빅데이터분석기사
[TIL/빅데이터분석기사] 2024/03/10
✅ 60문항 핵심요약🍀1\. DIKW 피라미드는 데이터, 정보, 지식, 지혜로 구성된다. (O) 2\. 빅데이터는 다양하고 대규모의 데이터에서 저비용으로 가치를 추출할 수 있어 비용 효율적이다. (O)3\. 빅데이터의 특징에는 Volume, Variety, Veloc
2024년 3월 10일6min read
✅ 60문항 핵심요약
🍀
1. DIKW 피라미드는 데이터, 정보, 지식, 지혜로 구성된다. (O)```
3. 빅데이터의 특징에는 Volume, Variety, Velocity의 3V와 Value, Veracity가 포함된 5V가 있다. (O)```
5. 편의점보다 저렴하게 컵라면을 팔고 있는 대형마트에서 사야겠다는 것은 지식의 사례에 해당한다. (O)```
7. 획득된 정보를 구조화하여 유의미한 정보로 분류하고 일반화하여, 고유의 아이디어로 만든 결과는 지식이다. (O)```
9. 랜덤 라운딩, 범위화, 감추기, 범주화는 데이터 범주화 기법에 해당한다. (O)```
🍀
11. 데이터 구조 정보를 함께 제공하는 형식은 반정형 데이터이다. (O)```
13. '개인정보 비식별 조치 가이드라인'은 데이터 활용이 증가함에 따라 개인정보 보호 강화에 대한 요구가 지속되어 개인정보 보호를 보장하면서 데이터를 활용하기 위해 만들어졌으며, 개인정보를 이용 또는 제공할 때 준수해야 할 조치 기준을 제시하고 있다. (O) ```
15. 개인정보 보호 관련 법령으로는 개인정보 보호법, 정보통신망법, 신용정보법, 위치정보 보호법, 안정성 확보 조치 기준 등이 있다. - 명예훼손법 X (O)```
17. 반정형 데이터는 형식과 구조가 변경될 수 있지만 데이터 구조 정보를 함께 제공하는 형식의 데이터이다. 유형에는 HTML, JSON, 로그 데이터, 센싱 데이터 등이 있다. (O)```
19. 빅데이터의 가치 선정이 어려운 이유로, 다양한 데이터 활용 방식, 새로운 가치 창출, 분석 기술의 발전이 있다. (O)```
🍀
21. 분석 문제를 정의하는 방식 중 하향식 접근법의 절차는, '문제 탐색 -> 분석 문제 정의 -> 해결 방안 탐색 -> 타당성 평가 -> 과제 선정'이다. (O)```
23. 분석 대상이 무엇인지 모르는 경우에 분석 대상 자체를 새롭게 도출하는 문제 해결 방안을 '발견'이라 한다. (O)```
25. 문제 해결 방안 분류 중 분석의 대상은 알고 있으나 방법을 알지 못하는 경우에는 솔루션 유형을 사용한다. (O)```
27. KDD는 데이터로부터 통계적인 패턴이나 지식을 찾기 위해 정리된 데이터 마이닝 프로세스로, '데이터 선택 -> 데이터 전처리 -> 데이터 변환 -> 데이터 마이닝 -> 해석과 평가'의 단계로 진행된다. (O)```
29. 문제를 정의할 수 없는 경우 데이터를 기반으로 문제를 정의하고 해결 방안을 탐색하는 방식으로 프로토타이핑 접근법, 디자인 사고 등 '상향식 접근법'을 사용한다. (O)```
🍀
31. 빅데이터 분석의 WBS(Work Breakdown Structure) 설정 시, 데이터 분석 모델링 및 검증 단계는, 데이터 준비 및 탐색을 토대로 분석 모델링을 진행하고 검증하는 일정을 수립하는 단계이다. (O)```
33. CRISP-DM 분석 방법론의 분석 절차는 '업무 이해 -> 데이터 이해 -> 데이터 준비 -> 모델링 -> 평가 -> 전개'의 순으로 진행된다. (O)```
35. CRISP-DM 분석 방법론의 평가 단계에서 수행하는 태스크는 '모델 적용성 평가'이다. (O)```
37. 하향식 접근법에서, 데이터의 문제로 전환하는 작업은 분석 문제 정의 단계에서 진행한다. - 문제 탐색 단계 X (O)```
39. 빅데이터 분석 방법론의 분석 기획 단계에서는 비즈니스 이해 및 범위 설정, 프로젝트 정의 및 계획 수립, 프로젝트 위험 계획 수립을 진행한다. (O)```
🍀
41. Crawling, API, RSS는 비정형 데이터 수집 기술이고, ETL은 정형 데이터 수집 기술이다. (O)```
43. 수집 대상 목록은 수집 가능성, 보안, 정확성, 수집 난이도, 수집 비용을 고려해서 작성한다. (O)```
45. 데이터 활용성의 특성은 데이터 유용성, 데이터 접근성, 데이터 보안성 등이다. (O)```
47. 데이터 웨어하우스란, 기업의 방대한 기간계 데이터를 통합 관리하여 의사결정 도구의 기초 데이터로 사용되는 데이터의 집합체로 사용자 관점에서 주제별로 데이터를 통합하는 기술이다. (O)```
49. 범주형 데이터는 명목 척도, 서열 척도, 등간 척도를 사용하고 수치형 데이터는 비율 척도나 등간 척도로 측정한다. (O)```
🍀
51. 이미지 파일, SNS 데이터, 영상 파일은 비정형 데이터이고, 웹 로그 파일은 반정형 데이터이다. (O)```
53. 범주형 데이터는 명목형, 순서형으로 구분되는 반면, 수치형 데이터는 이산형, 연속형으로 구분된다. (O)```
55. 생략```
57. 텍스트, 이미지, 오디오, 비디오 등 개별 객체로 구분되는 데이터는 콘텐츠 데이터이다. - 미디어 데이터 X (O)```
59. ETL은 추출(Extract), 가공(Transform), 적재(Load)의 단계로 정형 데이터를 수집하는 기술이다. (O)```
More to read
Amazon VPC
Amazon VPC Architecture 이해하기
새로운 프로젝트를 기획하며, 개발에서 무엇을 가장 먼저 고민해야 하는지 다시 돌아보게 되었습니다.한때는 프론트엔드가 모든 설계의 출발점이라고 믿었습니다. 유저가 무엇을 보고, 어떤 흐름에서 머무르고 이탈하는지에 대한 이해 없이 서비스를 만든다는 건 불가능하다고 생각했기
'원사이트'프론트엔드 관점으로 알고리즘 이해하기
오랜만에 방법론에 관한 글을 쓰게 되었습니다. 최근 상황은 이렇습니다. SSAFY에서는 하루에 엄청난 양의 알고리즘 문제들을 과제로 수행하게 됩니다. 그 과정에서, '구현력'이 매우 떨어진다는 생각이 들었습니다. 완전히 어려운 문제라면 '아쉬움'이라는 감정조차 느끼지
SubnetVPC 설계의 시작: IP와 Subnet
반복되는 루틴 속에서 얻은 안정감을 발판 삼아, 이제는 기술적 스펙트럼을 넓히기 위한 개인 프로젝트에 착수하고자 합니다.이번 프로젝트의 목표는 단순한 포트폴리오 구축을 넘어, 실제 서비스 수준의 블로그 시스템 구현과 다국어 처리 적용 등 실무에 가까운 역량을 한 단계