728x90
예상문제
- 암묵지와 형식지의 상호작용 관계
- 공통화 - 표출화 - 연결화 - 내면화
- SQL 집계함수 - 어떤 데이터의 타입에도 사용 가능한 것 (수치형+문자형)
- COUNT
- COUNT
- 개인정보 비식별화 기법 설명으로 부적절한 것
- 데이터마스킹 : 특정 데이터 값 삭제 처리 (: 새로운 데이터를 익명으로 생성하는 기술)
- 개인정보 비식별화 기법
- 가명처리 : 직접적으로 식별할 수 없는 다른 값으로 대체
- 범주화 : 해당 그룹의 대표 값으로 변환
- 총계처리 : 총합 또는 평균값으로 대체
- 일반적으로 파일 형태로 저장하는 데이터 : 반정형 데이터
- 지식(Knowledge)의 예시
- B 사이트보다 가격이 상대적으로 저렴한 A사이트에서 USB를 사야겠다.
- cf) 데이터 --> 정보 --> 지식 --> 지혜
- ~라고 판단 = 지혜
- fact = 데이터
- Cinematch 시스템 = Netflix
- 메타 데이터 : 다른 데이터를 설명해 주는 데이터 (데이터에 관한 구조화된 데이터)
- 데이터 거버넌스의 중요한 관리요소 中 1 [2과목 내용]
- 나머지 2개 = 데이터사전, 마스터 데이터
- 데이터 거버넌스의 중요한 관리요소 中 1 [2과목 내용]
- 인덱스 = 데이터를 신속하게 정렬/탐색하게 해주는 구조
- 데이터베이스 특징
- 통합된 데이터 Integrated
- 저장된 데이터 Stored
- 공용 데이터 Shared
- 변화되는 데이터 Changeable
- 빅데이터 3V (+ 4V)
- Volume 크기
- Variety 다양성
- Velocity 속도
- (Value 가치)
- 데이터웨어하우스의 고유한 특성이 아닌 것
- 데이터의 지속적 갱신에 따른 무결성 유지가 무엇보다 중요 (X)
- 데이터웨어하우스의 특성
- 주제 지향성
- 데이터 통합
- 데이터의 시계열성
- 데이터 비휘발성
- cf) 데이터웨어하우스란?
- 여러 소스에서 가져온 구조화된 데이터 + 반구조화된 데이터를 분석/보고하는 데 사용
- = 엔터프라이즈 시스템
- 임시 분석 & 커스텀 보고서 생성에 적합
- (주관식) 트레이딩, 공급, 수요예측 = 에너지
- 빅데이터의 정의와 가장 거리가 먼 것
- 하둡을 기반으로 하는 ~ (하둡 : 빅데이터 플랫폼 환경 구축 위해 사용) (X)
- 빅데이터현상이 출현하게 된 배경과 가장 거리가 먼 것
- 의료정보 등 공공데이터의 개방 가속화 (X)
- 의료정보 등 공공데이터의 개방 가속화 (X)
(추가예정)
제30 회 시험 복원
- 빅데이터가 만들어내는 본질적 변화
- 전수조사 (표본 x), 양 (질 x), 상관관계 (인과관계 x), 사후처리 (사전처리x)
- 비정형 데이터에서 정형 데이터로 변화 (X)
- 빅데이터 활용사례
- 기업에서는 정형화 된 데이터 + 비정형 데이터 수집 (정형화된 데이터만 수집 x)
- 미래사회의 특성과 빅데이터 역할
- 융합 - 창조력 / 리스크 - 대응력 / 불확실성 - 통찰력 / 스마트 (단순화 x) - 경쟁력
- 빅데이터 가치 산정이 어려운 이유
- 가치창출의 어려움
- 정보 = 지식을 도출 할 때 사용하는 데이터
- ERP = 기업의 모든 자원을 최적으로 관리하기 위한 시스템 = "통합"
제31 회 시험 복원
- 사물인터넷과 관련이 가장 큰 것
- 데이터화
- 해당 업무부서에서 분석을 수행하는 방식 (별도의 분석 조직 없음)
- 기능형
- 민주주의에서 빅데이터 사전 성향 분석 = 책임원칙 훼손
- 개인정보 사용 책임제 (동의제 x)
- 데이터베이스 = 종속성 x, 중복성 x
2023.07.22 - [분류 전체보기] - 데이터가 뭔데?
728x90
'Study > ADsP' 카테고리의 다른 글
[ADsP] 데이터분석 - 기출정리 (2) (0) | 2023.08.18 |
---|---|
[ADsP] 데이터분석 - 기출정리 (1) (0) | 2023.08.16 |
[ADsP] 데이터 분석 기획 - 기출정리 (0) | 2023.08.16 |
데이터가 뭔데? (0) | 2023.07.22 |