반응형
Kaggle 이라는 사이트에서 연습용 데이터를 다운받아 보겠습니다.
Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
www.kaggle.com
들어가셔서 titanic data를 받으면 되는데, 보통 머신러닝을 위한 연습용 데이터로 되어 있어서 3가지로 구분되어 있습니다.
상관하지 않고 다운 받으시면 됩니다.
https://www.kaggle.com/competitions/titanic
데이터에 대한 설명입니다.
survival 생존여부( 0 = 생존하지 못함, 1 = 생존함)
pclass 객실구분(1 = 퍼스트클래스..)
sex 성별
...
으로 구성되어 있으며 처음부터 데이터를 보면 무슨 말인지 모르니 꼭 Data Dictionary를 봐야겠더라구요 !
데이터 다운로드
csv 파일로 받으셨으면 지난 번 환경설정처럼 불러오시면 완성입니다 ^^
1
2
3
4
|
import pandas as pd
train = pd.read_csv('./titanic/train.csv', encoding = 'cp949')
# csv('파일경로')
|
cs |
타이타닉 데이터 미리보기
데이터는 잘 읽어와지네요
이제 타이타닉 데이터를 통해 즐거운 분석 시간 가져보시길 바랍니다 ! ^^
반응형
'파이썬(Python)' 카테고리의 다른 글
[Python] 정규표현식을 통한 숫자형태 변환 replace 함수활용 (1) | 2022.10.04 |
---|---|
[파이썬(Python)] 파이썬으로 엑셀 작동하기_조작방법(openpyxl) (0) | 2022.10.02 |
[한산-용의 출현] 댓글 수집하기 (0) | 2022.08.01 |
[파이썬] Python 데이터 분석 기본환경설정 (0) | 2022.07.17 |
[파이썬 / Python] 업무자동화에 대한 생각_크롤링 예시 (0) | 2022.06.04 |
댓글