✅ 60문항 핵심요약🍀1\. 단순회귀분석을 수행하기 위한 가정사항으로는 선형성, 정규성, 독립성, 등분산성의 4가지가 있다. (O) 2\. 최소제곱법이란, 회귀분석에서 각 독립변수에 대한 회귀계수를 추정하기 위한 방법으로 잔차의 제곱합이 최소가 되는 회귀식을 찾는 방
✅ 60문항 핵심요약
🍀
1. 단순회귀분석을 수행하기 위한 가정사항으로는 선형성, 정규성, 독립성, 등분산성의 4가지가 있다. (O)```
5. 전진선택법이란, 여러 개의 독립변수 후보들 중 가장 최적인 회귀방정식을 찾는 방법으로 상수항만 있는 모형에서 출발하여 벌점에 따라 변수를 추가하는 반복 작업을 통해 최적 회귀방정식을 찾아내는 방법이다. (O)```
7. 손실되는 정보가 최소가 되도록 분산이 가장 큰 축을 찾는 것이 주성분분석이다. (O)```
9. 회귀분석에서 다중공선성의 존재로 변수 간의 해석이 어려워지는 문제가 발생한다. 따라서 주성분분석을 활용함으로써 다중공선성의 문제를 해결할 수 있다. (O)```
🍀
11. 자기회귀 모형은, 현재의 시계열 자료는 n개의 이전 시점의 자료들로 설명이 가능하다는 전제로 적절한 n값을 찾기 위해 PACF 그래프를 활용한다. (O)```
13. 지도학습과 비지도학습은 완전히 다른 유형의 분석 방법으로 서로 비교할 수 없다. (O)```
15. 마트에서 손님들이 어떠한 물건을 구매하는지 파악하고 유형을 조사한다. - 군집분석을 수행하기에 적절한 사례 (O)```
17. 종속변수가 범주형일 경우 카이제곱 검정, 지니 지수, 엔트로피 지수 등을, 연속형일 경우 분산분석에서의 F통계량, 분산의 감소량 등을 사용한다. (O)```
🍀
21. 부스팅이란, 한 번에 여러 개의 붓스트랩을 만들지 않고 다음 분류기를 제작하기 위한 붓스트랩을 구성할 때 이전 분류기에 의하여 잘못 분류된 데이터에 더 큰 가중치를 주어 새로운 붓스트랩을 구성하여 최종 모형을 만드는 방법이다. (O)```
23. x축은 1-특이도의 값을 나타내며, Y축은 민감도의 값을 나타내어 모형의 이진 분류에 대한 성과를 평가하기 위한 그래프다. 그래프 아래 면적값이 클수록 모델의 성능이 우수하다고 말할 수 있다. - ROC 커브에 대한 설명 (O)```
25. 범주형 데이터의 거리를 측정하기 위한 측도로는 자카드 거리, 코사인 거리 등이 있다. (O)```
27. 최장연결법은 새롭게 생성된 군집 내의 데이터들과 군집 밖의 데이터의 거리 중 가장 먼 거리를 군집과 데이터의 거리로 사용한다. (O)```
29. 한 번 군집에 속한 데이터는 seed가 변경되어도 군집이 변하지 않는다. (X)```
🍀
31. 자기조직화지도에서 경쟁층에 표시된 노드는 n번의 iteration 동안 경쟁층의 현재 노드에서 이동될 수도, 이동되지 않을 수도 있다. (O)```
33. 실루엣 계수는 군집분석의 군집 정도를 평가하기 위한 지표다. (O)```
35. 연관분석 측도 중 신뢰도는, 두 품목의 서로에 대한 조건부 확률을 의미하며, 신뢰도 값이 크면 두 품목의 연관성이 높을 것으로 판단하기 쉽지만 향상도 값이 1보다 큰 경우에 의미가 있다. (O)```
37. 원하는 군집의 개수와 초깃값을 정해 군집을 형성한다 -> 각 데이터를 가장 가까운 seed가 있는 군집으로 분류한다 -> 각 군집의 seed 값을 다시 계산한다 -> 모든 개체가 군집으로 할당될 때까지 위의 과정을 반복한다 (K-means 군집분석의 수행 순서) (O)```
39. plyr 패키지에서 d는 데이터프레임, I는 리스트, a는 어레이를 의미한다. 따라서 리스트를 입력받아 데이터프레임을 출력하는 함수는 Idply이다. (O)```
🍀
41. LGBM(Light Gradient Boosting Machine)은 leaf-wise 방식을 사용한다. (O)```
43. 지수 분포는 연속형 확률분포다. (O)```
45. 비모수적 방법 중 짝지어진 두 개의 관찰치의 크고 작음에 대한 가설을 검증하는 방법은 '부호 검정'이다. (O)```
47. 표본의 분산에 대한 차이를 검정하기 위해서는 F-검정을 사용해야 한다. (O)```
🍀
53. 주성분분석에서 분산이 가장 큰 축을 제1주성분으로 결정한다. (O)```
55. 모집단의 원소에 차례대로 번호를 부여한 뒤 일정한 간격을 두고 데이터를 추출하는 방법은 '계통 추출법'이다. (O)```
57. 목표변수가 이산형인 경우에는 지니 지수, 연속형인 경우에는 분산감소량을 사용하는 알고리즘은 CART이다. (O)```
59. 서열척도는 관측지의 값을 순위로 나타내는 것이다. (O)```
✅ 회고
예전에는 행복하기 위해 노력했던 것 같다. 실체도 없는 그 행복이라는 허상을 쟁취하려고 매일을 참고 산 것이다. 그런데 행복은 그런 게 아니다. 친구들과 함께 나눴던 대화와 고민거리들, 목표를 가지고 서로 의지했던 공간, 여행지의 날씨처럼 행복의 형태는 지극히 심플하다.
그래서 요즘은 더 열심히 사는데, 행복을 얻기 위함이 아니라 이미 도처에 깔린 행복을 지키기 위해서다. 행복의 대상이 이미 너무 많다는 감사함에 대한 인지가, 되려 사람을 더 열심히 살게 만드는 것 같다. 더 열심히 해야지.