스터디📖/ML, DL

머신러닝 처음 시작하기(인프런) - 8강 의사 결정 나무

호프 2021. 8. 4. 23:02

https://www.inflearn.com/course/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%B2%98%EC%9D%8C-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0/dashboard

 

머신러닝 처음 시작하기 (기초 원리 + 초급 실습) - 인프런 | 강의

머신러닝을 처음 접하는 사람들을 대상으로 기초적인 머신러닝 이론을 간략하게 다룬 머신러닝 기초 강의입니다., 그것이 알고 싶다!요새 핫한 머신러닝 🤖 [사진] 🗒 강의소개 (이 강의는 강

www.inflearn.com

8강 의사 결정 나무

결정트리

  • 분류와 회귀 모두 가능한 지도 학습 모델
  • Yes or No 질문들로 이어가며 학습
    👉 즉, 특정 질문에 따라 데이터를 구분하는 학습
  • 한번의 분기떄마다 두 개로 구분
  • 질문이나 정답의 네모 상자 : Node
  • 맨 처음 분류 기준: Root Node
  • 맨 마지막 분류 기준: Terminal / Leaf Node

결정 트리 프로세스

  • 질문들을 기준으로 나눔
  • 나뉜 범주에서 또 다시 질문들을 기준으로 나눔(다만, 지나치게 나누면 오버피팅 가능성)
    -> 이를 막기 위한 방법: 가지치기

가지치기 종류:

  • 사전 가지치기(pre-pruning) 트리 생성을 일찍 중단. 트리의 최대 깊이 혹은 리프 노드의 최대 갯수 제한. 노드가 분할하기 위한 포인트의 최소한계 지정.
  • 사후 가지치기(post-pruning) 트리를 만든 후에 데이터 포인트가 적은 노드를 삭제하거나 병합

특성 중요도: 트리를 만드는 결정에 각 특성이 얼마나 중요한지를 보는 것. 0과 1 사이의 숫자. 특성 중요도의 전체 합은 1이 됨. ??^^ 뭐라는 거야 진짜ㅠㅠ

결정 트리 장점

알고리즘이 직관적
룰이 매우 뚜렷하며, 규칙 노드와 리프 노드를 알기 쉽고 규칙 파악 용이
전처리 같은 작업들이 덜 필요
++이외에 장점 더 설명해줬는데.. 그냥 입으로 후루룩 설명.. 수업 시간 발표보다도 퀄리티가 떨어진다..

단점

과적합 가능성 높음. 모델의 유연성 떨어짐. 일반성 부족. 상대적으로 정확도 떨어짐.