ADsP

[TIL/ADsP] 2024/03/25

✅ 40문항 핵심요약🍀1\. 앙상블 분석 시 모델 간에 상호 연관성이 높으면 과적합을 해결할 수 없다. (O) 2\. 다층 신경망에서 은닉층의 수가 너무 많아 역전파 과정에서 은닉층의 가중치 조정이 이루어지지 않고 이로 인해 학습이 제대로 이루어지지 않는 문제를 뜻하

2024년 3월 25일3min read

✅ 40문항 핵심요약

🍀

1. 앙상블 분석 시 모델 간에 상호 연관성이 높으면 과적합을 해결할 수 없다. (O)```
3. FP-Growth는 Apriori 알고리즘과 달리 후보반발집합을 생성하지 않는 연관 규칙 알고리즘이다. (O)```
5. 공분산의 범위는 음의 무한대 ~ 양의 무한대다. (O)```
7. 'ROC 커브'는 민감도와 특이도가 어떤 관계를 가지고 변하는지 이차원 평면상에 y축은 민감도를, x축은 1-특이도 값을 갖는 그래프로 모형을 평가하는 그림이다. (O)```
9. 제1종 오류와 제2종 오류 모두 최소가 될 수 없기에 제1종 오류가 허용하는 최소한의 확률을 설정하는데, 이를 유의수준이라 한다. (O)```

🍀

11. 결측치가 많을 경우 많은 데이터 손실이 발생하므로 적절한 처리 방안 마련이 필요하다. (O)```
13. 군집분석의 평가 지표로 응집도와 분리도를 계산하며 그 값이 1에 가까울수록 완벽하게 분리되었다고 판단하는 지표는 '실루엣 계수'이다. (O)```
15. 재표본 과정에서 분류가 잘못된 데이터에 더 큰 가중치를 부여해 표본을 추출하는 앙상블 기법을 '부스팅'이라 한다. (O)```
17. p.375 2번 참고 (O)```
19. 군집분석은 가장 거리가 가까운 데이터끼리 n개의 그룹으로 클러스터링하는 기법이다. (O)```

🍀

21. 유의확률이 유의수준보다 작을 경우 귀무가설을 기각한다. (O)```
23. 생략```
25. 신뢰도가 커도 향상도가 1보다 작다면 같이 진열될 경우 구매 확률의 감소를 의미한다. (O)```
27. sqldf 패키지는 사용자가 SQL 문장을 활용하여 데이터프레임을 다룰 수 있도록 도와준다. (O)```
29. 모집단으로부터 복원 추출에 의하여 생성되는 표본집단으로 모집단과 동일한 크기를 갖는 집단은 '붓스트랩'이다. (O)```

🍀

31. 분산분석은 두 개 이상의 집단에 대하여 평균을 비교하는 가설검정이다. (O)```
33. p.378 18번 참고```
35. p.378 20번 참고```
37. k-NN은 분류분석 혹은 회귀분석에 사용되는 방법이지만, 주변 K개의 데이터를 탐색하여 다수결 방식에 의하여 결측값을 대체하는 결측값 처리 방법으로도 활용될 수 있다. (O)```
39. 비모수적 방법은 통계적 추론에 있어서 평균과 분산을 활용하지 않는다. (O)```

✅ 회고

현대 경영학의 창시자로 평가받는 '경영민수', 피터 드러커는 "측정할 수 없다면 관리할 수 없고, 관리할 수 없다면 개선할 수 없다."라는 잔소리를 남긴 바 있다.

개선하고 싶다. 그렇다면 관리해야 한다. 관리하고 싶다? 측정해야 한다. 마이크로 단위로 부지런히 계측하고 테스트하는 요즘이다.