데이터분석2 [빅분기] 과목1: 빅데이터 분석 기획 해당 강의를 보면서 요약해서 작성했음을 밝힙니다1. 빅데이터 개요 및 활용- 빅데이터의 특징빅데이터 활용을 위한 3대 요소: 인자기 (인력, 자원(데이터), 기술)빅데이터의 3V (가트너 정의): Volume(규모), Variety(다양성), Velocity(속도) + Value(가치)DIKW 피라미드: Data, Information, Knowledge, Wisdom데이터 베이스의 개념DB: 일정 구조에 맞게 조직화된 데이터의 집합- 스키마: DB의 구조와 제약조건에 관한 전반적 명세 (외부 스키마, 개념 스키마, 내부스키마)- 메타데이터: 데이터를 설명하는 데이터, 데이터 구조를 설명하고 검색하는데 활용DBMS: DB를 관리, 접근 환경을 제공하는 소프트웨어- DDL: CREATE, ALTER, DR.. 2025. 3. 31. Part 1. 머신러닝을 위한 최소한의 수학/통계 (CH 04_ 확률) 목차 통계의 경우 오랜 시간동안 배워야 하기 때문에 확률과 정보이론에 관한 내용을 위주로 공부할 예정 4-1. 확률 1. random experiments - 주사위, 외부 상황에 시시각각 바뀌기 때문에 랜덤하다고 생각할 수 있음. - 로또나 도박과 뗄 수 없음. ( deterministic) 2. sample space - 1에서 얻을 수 있는 모든 원소들의 집합. - descrete한 샘플 들의 집합. - 이 모든 확률들을 sample space라고 정의할 수 있음. 3. outcomes - sample space가 가지고 있는 원소 4. events - outcome에서 조건을 넣은 경우 - 우리가 가지고 있는 sample space의 subset이라고 말할 수 있음. 5. probabilities.. 2022. 7. 12. 이전 1 다음