최종실습 - 타이타닉1
kaggle -> titanic 데이터 이용
타이타닉에서 사람들이 살아남는지 살아남지 못하는 지 예측하는 것.
from google.colab import files
uploaded = files.upload() #코랩에서 파일 불러오는 방식. 파일 선택
import pandas as pd
import io
df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8'))) #train dataset 불러오고 dataframe으로 변환
train = df
print(train) #train 데이터 확인
df0 = pd.read_csv(io.StringIO(uploaded['test.csv'].decode('utf-8')))
test = df0
print(test) #test 데이터 확인
train.info() #train 데이터 정보 출력
test.info() #test 데이터 정보 출력
train.head() #5개 행 데이터 확인
test.head()
train.describe(include='all') #더 자세한 정보 확인 가능
print(train.columns) #train data feature 확인
print(pd.isnull(train).sum()) #널 값(결측치) 확인
print(pd.isnull(test).sum())
'스터디📖 > ML, DL' 카테고리의 다른 글
머신러닝 처음 시작하기(인프런) - 18강 최종 실습 - 타이타닉3 (0) | 2021.08.19 |
---|---|
머신러닝 처음 시작하기(인프런) - 17강 최종실습 - 타이타닉2 (0) | 2021.08.18 |
머신러닝 처음 시작하기(인프런) - 15강 데이터 전처리 (0) | 2021.08.16 |
머신러닝 처음 시작하기(인프런) - 14강 train valid test 데이터 나누기 (0) | 2021.08.13 |
머신러닝 처음 시작하기(인프런) - 13강 knn 구현 (0) | 2021.08.12 |