본문 바로가기
파이썬(Python)

[Python] Kaggle 에서 데이터 다운받기

by Serendipity_ 2022. 7. 24.
반응형

 Kaggle 이라는 사이트에서  연습용 데이터를 다운받아 보겠습니다.

 

https://www.kaggle.com/

 

Kaggle: Your Machine Learning and Data Science Community

Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

www.kaggle.com

들어가셔서  titanic data를 받으면 되는데, 보통 머신러닝을 위한 연습용 데이터로 되어 있어서 3가지로 구분되어 있습니다.

상관하지 않고 다운 받으시면 됩니다. 

 

https://www.kaggle.com/competitions/titanic

 

데이터에 대한 설명입니다. 

survival 생존여부( 0 = 생존하지 못함, 1 = 생존함)

pclass 객실구분(1 = 퍼스트클래스..)

sex 성별

...

으로 구성되어 있으며 처음부터 데이터를 보면 무슨 말인지 모르니 꼭 Data Dictionary를 봐야겠더라구요 ! 

 

데이터 다운로드

csv 파일로 받으셨으면 지난 번 환경설정처럼 불러오시면 완성입니다 ^^ 

1
2
3
4
import pandas as pd
 
train = pd.read_csv('./titanic/train.csv', encoding = 'cp949')
# csv('파일경로')
cs

타이타닉 데이터 미리보기

 

데이터는 잘 읽어와지네요

 

이제 타이타닉 데이터를 통해 즐거운 분석 시간 가져보시길 바랍니다 ! ^^ 

 

 

반응형

댓글