빅데이터분석기사

[TIL/빅데이터분석기사] 2024/03/10

✅ 60문항 핵심요약🍀1\. DIKW 피라미드는 데이터, 정보, 지식, 지혜로 구성된다. (O) 2\. 빅데이터는 다양하고 대규모의 데이터에서 저비용으로 가치를 추출할 수 있어 비용 효율적이다. (O)3\. 빅데이터의 특징에는 Volume, Variety, Veloc

2024년 3월 10일6min read

✅ 60문항 핵심요약

🍀

1. DIKW 피라미드는 데이터, 정보, 지식, 지혜로 구성된다. (O)```
3. 빅데이터의 특징에는 Volume, Variety, Velocity의 3V와 Value, Veracity가 포함된 5V가 있다. (O)```
5. 편의점보다 저렴하게 컵라면을 팔고 있는 대형마트에서 사야겠다는 것은 지식의 사례에 해당한다. (O)```
7. 획득된 정보를 구조화하여 유의미한 정보로 분류하고 일반화하여, 고유의 아이디어로 만든 결과는 지식이다. (O)```
9. 랜덤 라운딩, 범위화, 감추기, 범주화는 데이터 범주화 기법에 해당한다. (O)```

🍀

11. 데이터 구조 정보를 함께 제공하는 형식은 반정형 데이터이다. (O)```
13. '개인정보 비식별 조치 가이드라인'은 데이터 활용이 증가함에 따라 개인정보 보호 강화에 대한 요구가 지속되어 개인정보 보호를 보장하면서 데이터를 활용하기 위해 만들어졌으며, 개인정보를 이용 또는 제공할 때 준수해야 할 조치 기준을 제시하고 있다. (O) ```
15. 개인정보 보호 관련 법령으로는 개인정보 보호법, 정보통신망법, 신용정보법, 위치정보 보호법, 안정성 확보 조치 기준 등이 있다. - 명예훼손법 X (O)```
17. 반정형 데이터는 형식과 구조가 변경될 수 있지만 데이터 구조 정보를 함께 제공하는 형식의 데이터이다. 유형에는 HTML, JSON, 로그 데이터, 센싱 데이터 등이 있다. (O)```
19. 빅데이터의 가치 선정이 어려운 이유로, 다양한 데이터 활용 방식, 새로운 가치 창출, 분석 기술의 발전이 있다. (O)```

🍀

21. 분석 문제를 정의하는 방식 중 하향식 접근법의 절차는, '문제 탐색 -> 분석 문제 정의 -> 해결 방안 탐색 -> 타당성 평가 -> 과제 선정'이다. (O)```
23. 분석 대상이 무엇인지 모르는 경우에 분석 대상 자체를 새롭게 도출하는 문제 해결 방안을 '발견'이라 한다. (O)```
25. 문제 해결 방안 분류 중 분석의 대상은 알고 있으나 방법을 알지 못하는 경우에는 솔루션 유형을 사용한다. (O)```
27. KDD는 데이터로부터 통계적인 패턴이나 지식을 찾기 위해 정리된 데이터 마이닝 프로세스로, '데이터 선택 -> 데이터 전처리 -> 데이터 변환 -> 데이터 마이닝 -> 해석과 평가'의 단계로 진행된다. (O)```
29. 문제를 정의할 수 없는 경우 데이터를 기반으로 문제를 정의하고 해결 방안을 탐색하는 방식으로 프로토타이핑 접근법, 디자인 사고 등 '상향식 접근법'을 사용한다. (O)```

🍀

31. 빅데이터 분석의 WBS(Work Breakdown Structure) 설정 시, 데이터 분석 모델링 및 검증 단계는, 데이터 준비 및 탐색을 토대로 분석 모델링을 진행하고 검증하는 일정을 수립하는 단계이다. (O)```
33. CRISP-DM 분석 방법론의 분석 절차는 '업무 이해 -> 데이터 이해 -> 데이터 준비 -> 모델링 -> 평가 -> 전개'의 순으로 진행된다. (O)```
35. CRISP-DM 분석 방법론의 평가 단계에서 수행하는 태스크는 '모델 적용성 평가'이다. (O)```
37. 하향식 접근법에서, 데이터의 문제로 전환하는 작업은 분석 문제 정의 단계에서 진행한다. - 문제 탐색 단계 X (O)```
39. 빅데이터 분석 방법론의 분석 기획 단계에서는 비즈니스 이해 및 범위 설정, 프로젝트 정의 및 계획 수립, 프로젝트 위험 계획 수립을 진행한다. (O)```

🍀

41. Crawling, API, RSS는 비정형 데이터 수집 기술이고, ETL은 정형 데이터 수집 기술이다. (O)```
43. 수집 대상 목록은 수집 가능성, 보안, 정확성, 수집 난이도, 수집 비용을 고려해서 작성한다. (O)```
45. 데이터 활용성의 특성은 데이터 유용성, 데이터 접근성, 데이터 보안성 등이다. (O)```
47. 데이터 웨어하우스란, 기업의 방대한 기간계 데이터를 통합 관리하여 의사결정 도구의 기초 데이터로 사용되는 데이터의 집합체로 사용자 관점에서 주제별로 데이터를 통합하는 기술이다. (O)```
49. 범주형 데이터는 명목 척도, 서열 척도, 등간 척도를 사용하고 수치형 데이터는 비율 척도나 등간 척도로 측정한다. (O)```

🍀

51. 이미지 파일, SNS 데이터, 영상 파일은 비정형 데이터이고, 웹 로그 파일은 반정형 데이터이다. (O)```
53. 범주형 데이터는 명목형, 순서형으로 구분되는 반면, 수치형 데이터는 이산형, 연속형으로 구분된다. (O)```
55. 생략```
57. 텍스트, 이미지, 오디오, 비디오 등 개별 객체로 구분되는 데이터는 콘텐츠 데이터이다. - 미디어 데이터 X (O)```
59. ETL은 추출(Extract), 가공(Transform), 적재(Load)의 단계로 정형 데이터를 수집하는 기술이다. (O)```