본문 바로가기
728x90

Study/ADsP5

[ADsP] 데이터분석 - 기출정리 (2) 제32 회 시험 복원 유의수준 가설검정 용어 귀무가설이 옳은데도 이를 기각하는 확률의 크기 리스트 R에서 데이터 타입이 같지 않은 객체들을 하나의 객체로 묶어놓을 수 있는 자료구조 잡음 무작위적인 변동 원인 알려져있지 x (중요) 연관분석 카탈로그 배열, 교타판매 등의 마케팅 계획 시 적절한 데이터 마이닝 기법 고객과 '연관'된 데이터 분석이 중요하다고 암기 혼합 분포 군집 모형기반 군집방법 모수와 함께 가중치를 자료로부터 추정하는 방법으로 사용 카이제곱 검정 모수적 검정방법 cf) 비모수적 검정방법 : 맨-휘트니 U검정, 런 검정, 윌콕슨의 순위합 검정 유사도 측도 유클리드거리 두 점을 잇는 가장 짧은 직선거리 공통으로 저수를 매긴 항목의 거리를 통해 판단하는 측도 맨하탄 거리 각 방향 직각의 이동거리.. 2023. 8. 18.
[ADsP] 데이터분석 - 기출정리 (1) 제30 회 시험 복원 민코우스키 거리 수식 큰 괄호 안에 시그마 있는 공식 변수의 표준화 + 상관성을 동시에 고려한 통계적 거리 [계층적 군집방법 = 거리에 대한 정의 필요] 마할라노비스 거리 앙상블 모형의 특징 각 모형의 상호 연관성이 높을수록 -- 정확도 하락 k평균 군집 한번 군집이 형성되더라도 다른 군집으로 이동 가능 O 로지스틱 회귀모형의 검정 방법 = 카이제곱 검정 주성분 분석에서 변수의 중요도 기준이 되는 값 = 고윳값 주성분 개수선택 방법 평균 고윳값 = 평균 구한 후 평균값 이상이 되는 주성분을 설정하는 것 (제거x) 잔차분석에서 만족해야 하는 가정 (회귀분석의 결과 中) 독립성 - 등분산성 - 정규성 분해요소에 대한 설명 (시계열 요소분해법) 순환변동 = 알려지지 않은 주기를 가지고 변.. 2023. 8. 16.
[ADsP] 데이터 분석 기획 - 기출정리 제30 회 시험 복원 데이터 거버넌스 구성요소 원칙 조직 절차 과제 중심적 접근방식 Speed & Test = 1차 목표 Quick & Win = 과제 유형 문제 해결 = 접근 방식 장기적 마스터 플랜 Accuracy & Deploy = 1차 목표 Long Term View = 과제 유형 문제 정의 = 접근 방식 데이터 거버넌스의 중요한 관리대상 a,b,c 마스터 데이터 메타 데이터 데이터사전 시급성 = 전략적 중요도가 핵심, KPI 함께 고려하여 시급성 여부 판단 제31 회 시험 복원 데이터 분석 조직구조 분산구조 : 분석 조직 인력 --> 현업부서에 직접 배치 분석대상 인지 O / 분석 방법 이해 X 설루션 분석 유즈 케이스 : 향후 데이터 분석 문제로의 전환 및 적합성 평가에 활용 분석기회를 구체적.. 2023. 8. 16.
[ADsP] 데이터의이해 - 기출정리 예상문제 암묵지와 형식지의 상호작용 관계 공통화 - 표출화 - 연결화 - 내면화 SQL 집계함수 - 어떤 데이터의 타입에도 사용 가능한 것 (수치형+문자형) COUNT 개인정보 비식별화 기법 설명으로 부적절한 것 데이터마스킹 : 특정 데이터 값 삭제 처리 (: 새로운 데이터를 익명으로 생성하는 기술) 개인정보 비식별화 기법 가명처리 : 직접적으로 식별할 수 없는 다른 값으로 대체 범주화 : 해당 그룹의 대표 값으로 변환 총계처리 : 총합 또는 평균값으로 대체 일반적으로 파일 형태로 저장하는 데이터 : 반정형 데이터 지식(Knowledge)의 예시 B 사이트보다 가격이 상대적으로 저렴한 A사이트에서 USB를 사야겠다. cf) 데이터 --> 정보 --> 지식 --> 지혜 ~라고 판단 = 지혜 fact = 데.. 2023. 7. 24.
데이터가 뭔데? 데이터와 정보 데이터 : 추론과 추정의 근거를 이루는 사실 / 다른 객체와의 상호관계 속에서 가치를 갖는 것 데이터의 특성 존재적 특성 : 객관적 사실 (Fact) 당위적 특성 : 추론, 예측, 전망, 추정을 위한 근거 (Basis) 데이터의 유형 정성적 데이터 : 통계분석 어려움 정량적 데이터 : 통계분석 용이 암묵지 - 공통화, 내면화 (개인에게 축적된 내면화된 지식 -- 조직의 지식으로 공통화) 형식지 - 표출화, 연결화 (언어, 기호, 숫자로 표출화된 지식 -- 개인의 지식으로 연결화) 암묵지와 형식지의 상호작용관계 1단계 : 공통화 2단계 : 표출화 (암묵지를 형식지로 만들기) 3단계 : 연결화 4단계 : 내면화 DIKW 피라미드 Data 데이터 : 객관적 사실 (Fact) A마트는 50원, B.. 2023. 7. 22.
728x90