Growth Hoon

20230820_TIL_JP스터디 : 회귀분석, Clustering, Entropy 계수 본문

TIL_Today I Learned

20230820_TIL_JP스터디 : 회귀분석, Clustering, Entropy 계수

sayhoon 2023. 8. 20. 22:50

오늘의 한 줄 TIL : 스터디를 통해서 용어의 어원과 자세히 몰랐던 지식을 알게 되었다.


한음님의 머신러닝 관련 미니 강의

- 관계식을 통계에 적용하는 행위가 "회귀"
- 개념은 회귀, 표현은 함수로 한다.

- 차원은 거리를 측정한다는 느낌
- 비지도 학습에서 차원 축소는 더 적은 특징(feature)으로 데이터를 해석하는 것

- 군집화 (Clustering)의 어원은 clod 라는 단어에서 왔다. clod는 덩어리라는 뜻으로,

   cluster (무리), club(떼, 뭉치), cloud (구름, 덩어리)와 같은 계열이다.
   즉, 군집화는 유사한 데이터들을 덩어리로 만들어주는 행위 ! 

 

헌수님의 머신러닝 관련 미니 강의

- 선형회귀는 영향력을 비교하는 목적으로 주로 사용

- 의사 결정나무(Decision tree)는 어떤 변수가 어떤 범주에 속할지 알려주는 분류 모델

- DT는 엔트로피 계수로 분기를 한다.

- 엔트로피 계수의 수식이 의미하는 건 뭐지?

- 엔트로피 계수의 대안으로 지니 계수를 사용하는데 어떤 경우에 사용하는 걸까?

- 분할 시 계산되는 불확실성 차이(= 정보이득) 에 대해서 자세히 설명해주셨다.


스터디의 미니 강의를 통해서 용어에 대한 더 자세한 내용을 배우고,

깊이를 더해가는 기분이다 !

 

# 나중에 공부해야 할 내용

1. 엔트로피 계수의 수식이 의미하는 바

2. 지니 계수가 의미하는 바는 무엇이고, 어떤 경우에 대안으로 사용되는지?

3. 정보 이득을 통해서 분할을 하는데 어떻게 분할을 하는지 더 자세하게 알아보자