통계학 5

베이지안 통계

베이즈 정리와 사전/사후 확률 베이즈 정리는 기존의 사전 확률을 새로운 증거를 바탕으로 갱신하여 사후 확률을 계산하는 방법을 제공→ 통계적 추론, 머신러닝, 의학적 진단 등 다양한 분야에서 활용 베이즈 정리P(A|B) = P(B|A) * P(A) / {P(B) 사전 확률 (Prior Probability, (P(A))): 새로운 정보를 얻기 전 특정 사건 (A) 가 발생할 확률우도 (Likelihood, (P(B|A))): 사건 (A) 가 발생했을 때 증거 (B) 가 나타날 확률사후 확률 (Posterior Probability, (P(A|B))): 증거 (B) 가 주어졌을 때 사건 (A) 가 발생할 확률증거 (Evidence, (P(B))): 증거 (B) 가 발생할 전체 확률 활용 사례조건부 확률 계산..

통계적 추론과 가설 검증

통계적 추론과 가설 검증 머신러닝 및 딥러닝 모델 평가에서 정확한 데이터 분석과 실험 결과 해석을 가능하게 하는 필수적인 도구 표본 분포와 중심극한정리 표본 분포(sample distribution) 표본 통계량(예: 표본 평균)의 분포중심극한정리(Central Limit Theorem, CLT)에 따르면 표본 크기가 충분히 크면 표본 평균의 분포는 정규분포에 근사하게 됨  표본 평균의 분포 N(μ, σ²/n) μ : 모평균 (population mean)σ² : 모분산 (population variance)n : 표본 크기 (sample size) 표준 오차(Standard Error, SE) 표본 통계량의 표준편차→ 추정의 정확도를 나타냄  적용신뢰구간 추청가설 검정부트스트랩 방법 적용분석표본 크기 ..

데이터 산포도

데이터 산포도 데이터가 중심 경향치로부터 얼마나 퍼져 있는지를 나타내는 지표데이터의 분포와 변동성을 파악하는데 중요한 역학을 함  분산과 표준편차 분산(Variance)데이터가 평균으로부터 얼마나 퍼져있는지를 나타내는 지표    σ² = Σ(x - x̄)² / N 또는   $$ \sigma^2 = \bar{x^2} - \bar{x}^2 $$">$$ \sigma^2 = \bar{x^2} - \bar{x}^2 $$각 데이터 포인트와 평균의 차이를 제곱한 값들의 평균 장점 : 모든 데이터 포인트를 고려하여 변동성을 정확히 측정 가능단점 : 원래 데이터 단위와 다른 단위(제곱된 단위)를 가지므로 해석이 어려울 수 있음활용 예 : 금융 리스크 분석, 품질 관리, 데이터 변동성 평가   분산식에서 제곱이 갖는 의..

데이터 종류의 이해

데이터의 종류 데이터의 종류는 분석 및 해석의 기본이 되는 요소로, 데이터의 특성에 따라 적용할 수 있는 기법과 해석 방법이 달라짐   • 정성적 데이터 (질적 데이터) 수치가 아닌 범주형 데이터로, 주로 특성이나 속성을 나타냄 명목형 데이터 (Nominal Scale)순서와 크기가 없는 범주로 구분된 데이터 - 명목 척도, 단순 분류 성별: 남/여혈액형: A, B, AB, O직업군: 교사, 의사, 엔지니어 주요 분석 기법• 최빈값 (Mode): 가장 자주 등장하는 범주 확인 • 빈도 분석: 범주별 데이터 빈도 계산 • 카이제곱 검정: 범주형 변수 간의 관계 분석 서열형 데이터 (Ordinal Scale)순서가 있지만, 간격의 크기가 일정하지 않은 데이터 - 서열 척도 만족도 조사: 매우 만족, 만족, ..

통계학과 데이터 분석

인공지능과 통계학의 관계 인공지능(AI)과 통계학은 밀접하게 연결되어 있으며, AI의 발전은 통계학적 개념과 방법론을 기반으로 이루어진 경우가 많음   통계학 : AI의 이론적 기반 AI 시스템이 데이터를 처리하고 불확실성을 다루는 데 필요한 이론적 토대를 제공예 : 확률론은 데이터의 불확실성을 모델링하거나 결과를 예측하는 데 필수적→ 통계학에서 유래된 머신러닝 알고리즘→ 많은 머신러닝 알고리즘이 통계적 모델에서 발전선형 회귀 : 데이터를 직선으로 표현하여 관계를 설명로지스틱 회귀 : 이진 분류 문제에서 데이터의 확률적 분포를 모델링나이브 베이즈 분류기 : 조건부 확률에 기반한 분류 모델 *AI에서 선형대수와 통계학의 역할 비교 선형대수통계학데이터 표현벡터와 행렬로 데이터를 표현하고 계산데이터를 통계적 ..

728x90