스터디📖/ML, DL

머신러닝 처음 시작하기(인프런) - 16강 최종실습 - 타이타닉1

호프 2021. 8. 17. 20:21

https://www.inflearn.com/course/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%B2%98%EC%9D%8C-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0/dashboard

 

머신러닝 처음 시작하기 (기초 원리 + 초급 실습) - 인프런 | 강의

머신러닝을 처음 접하는 사람들을 대상으로 기초적인 머신러닝 이론을 간략하게 다룬 머신러닝 기초 강의입니다., 그것이 알고 싶다!요새 핫한 머신러닝 🤖 [사진] 🗒 강의소개 (이 강의는 강

www.inflearn.com

최종실습 - 타이타닉1

kaggle -> titanic 데이터 이용

타이타닉에서 사람들이 살아남는지 살아남지 못하는 지 예측하는 것.

from google.colab import files
uploaded = files.upload() #코랩에서 파일 불러오는 방식. 파일 선택

import pandas as pd
import io

df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8'))) #train dataset 불러오고 dataframe으로 변환
train = df
print(train) #train 데이터 확인
df0 = pd.read_csv(io.StringIO(uploaded['test.csv'].decode('utf-8')))
test = df0
print(test) #test 데이터 확인

train.info() #train 데이터 정보 출력
test.info() #test 데이터 정보 출력

train.head() #5개 행 데이터 확인
test.head()
train.describe(include='all') #더 자세한 정보 확인 가능

print(train.columns) #train data feature 확인
print(pd.isnull(train).sum()) #널 값(결측치) 확인
print(pd.isnull(test).sum())