스터디📖/ML, DL

머신러닝 처음 시작하기(인프런) - 12강 KNN

호프 2021. 8. 11. 15:09

https://www.inflearn.com/course/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%B2%98%EC%9D%8C-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0/dashboard

 

머신러닝 처음 시작하기 (기초 원리 + 초급 실습) - 인프런 | 강의

머신러닝을 처음 접하는 사람들을 대상으로 기초적인 머신러닝 이론을 간략하게 다룬 머신러닝 기초 강의입니다., 그것이 알고 싶다!요새 핫한 머신러닝 🤖 [사진] 🗒 강의소개 (이 강의는 강

www.inflearn.com

12강 KNN

KNN 이란?

- 분류를 하기 위해서 주로 사용되는 모델
- KNN이란 새로운 데이터가 주어졌을 때 기존 데이터 가운데 가장 가까운 K개의 이웃 정보로 새로운 데이터를 예측하는 방법론
- K를 정하는 것이 중요

K 정하기

최근접을 몇 개까지 볼 것인가를 정한다.

표준화

거리를 재는 방법..

  • distance^2 = a^2 + b^2
  • 유클리드 거리법
  • 맨해튼 거리 - x축과 y축을 따라서 가는 거리

장단점

게으른 모델 = 별도 모델 생성 과정 없이 각각의 관측치를 이용해서 분류 및 회귀 작업을 수행하기 때문

  • 장점: 학습 데이터 내의 노이즈 값에 영향을 덜 받음. 효과적
  • 단점: K와 어떤 거리 척도가 분석에 적합한 지 불문명해서 매번 데이터 척도에 맞게 임의로 정해야 함.