머신러닝 처음 시작하기(인프런) - 14강 train valid test 데이터 나누기

2021. 8. 13. 12:03· 스터디📖/ML, DL
목차
  1. 데이터셋 나누기 Train / Test set
  2. 교차검증

https://www.inflearn.com/course/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%B2%98%EC%9D%8C-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0/dashboard

 

머신러닝 처음 시작하기 (기초 원리 + 초급 실습) - 인프런 | 강의

머신러닝을 처음 접하는 사람들을 대상으로 기초적인 머신러닝 이론을 간략하게 다룬 머신러닝 기초 강의입니다., 그것이 알고 싶다!요새 핫한 머신러닝 🤖 [사진] 🗒 강의소개 (이 강의는 강

www.inflearn.com

14강 train valid test 데이터 나누기

데이터셋 나누기 Train / Test set

  • 딥러닝 : training / validation / test
  • 머신러닝 : training / test

- training과 validation을 가지고 훈련을 한 후 모델을 만들어 test 데이터로 test를 함.
- validation = train 과정에서 모델이 잘 학습이 되는 지 알기 위해 쓰임. 중간중간 평가하는 데이터

교차검증

모델을 평가하는 방법 중 하나
test 데이터가 적을 때 문제점을 해결하기 위한 것.

K-Fold

  1. 데이터를 K개로 쪼갠 후 하나는 검증 데이터, 나머지는 훈련 데이터로 만들어서 성능을 구함
  2. 이 과정을 K번 반복함
  3. K번의 성능의 평균을 구함

모델 성능 평가 지표

실제정답 / 머신러닝 모델의 답 True False
True a b
False c d

Precision(정밀도) = a / (a+c)

- 모델이 true로 예측한 값들 중에서 알맞게 예측한 비율
재현율 = a / (a+b)

- true로 잘 예측한 비율(?)
Accuracy = (a+d) / (a+b+c+d)

- 전체 클래스 중 제대로 잘 예측한 비율
F1 Score(정밀도와 재현도의 조화평균) = 2*(정밀도*재현율) / (정밀도+재현율)

저작자표시 (새창열림)

'스터디📖 > ML, DL' 카테고리의 다른 글

머신러닝 처음 시작하기(인프런) - 16강 최종실습 - 타이타닉1  (0) 2021.08.17
머신러닝 처음 시작하기(인프런) - 15강 데이터 전처리  (0) 2021.08.16
머신러닝 처음 시작하기(인프런) - 13강 knn 구현  (0) 2021.08.12
머신러닝 처음 시작하기(인프런) - 12강 KNN  (0) 2021.08.11
머신러닝 처음 시작하기(인프런) - 11강 랜덤 포레스트 구현  (0) 2021.08.10
  1. 데이터셋 나누기 Train / Test set
  2. 교차검증
'스터디📖/ML, DL' 카테고리의 다른 글
  • 머신러닝 처음 시작하기(인프런) - 16강 최종실습 - 타이타닉1
  • 머신러닝 처음 시작하기(인프런) - 15강 데이터 전처리
  • 머신러닝 처음 시작하기(인프런) - 13강 knn 구현
  • 머신러닝 처음 시작하기(인프런) - 12강 KNN
호프
호프
호프
Untitled
호프
전체
오늘
어제
  • 분류 전체보기 (341)
    • 오류😬 (4)
    • 스터디📖 (96)
      • 웹 개발 기초 (8)
      • Spring (20)
      • ML, DL (30)
      • Node.js (22)
      • React (0)
      • 블록체인 (12)
      • Go (3)
      • Javascript (1)
    • 알고리즘💻 (153)
      • 그리디 (23)
      • Bruteforce&Backtracking (16)
      • DP (17)
      • 이분탐색&정렬&분할정복 (17)
      • 누적합&투포인터 (6)
      • 스택&큐&덱 (19)
      • 그래프(DFS&BFS) (19)
      • 트리 (7)
      • 우선순위큐&다익스트라 (11)
      • 벨만포드&플로이드와샬 (8)
      • map&set&number theory (5)
      • 기타 (5)
    • 프로젝트 (3)
      • 캡스톤 디자인 프로젝트 (3)
    • 블록체인🔗 (3)
      • Solana (2)
      • 개발 (0)
      • Harmony (1)
    • ASC (6)
    • CS (73)
      • 데이터베이스 (12)
      • 클라우드컴퓨팅 (21)
      • 운영체제 (11)
      • 컴퓨터네트워크 (14)
      • 블록체인응용 (15)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 복습

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.1
호프
머신러닝 처음 시작하기(인프런) - 14강 train valid test 데이터 나누기
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.