딥러닝 19

인공 신경망(Artificial Neural Network, ANN)

인공 신경망(ANN) 생물학적 신경망을 모방한 컴퓨팅 시스템 입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 구성각 층은 뉴런(Neuron)으로 이루어져 있으며, 가중치(Weight)와 활성화 함수(Activation Function)를 사용해 데이터를 처리 입력층 : 입력 데이터를 받아들이는 층입력  뉴런 수는 입력 데이터의 특징(Feature) 수와 동일은닉층 : 입력 데이터를 처리하고 특징을 추출하는 층뉴런 수와 층 수에 따라 모델 성능이 결정됨출력층 : 최종 예측 값을 출력하는 층뉴런 수는 예측하려는 클래스 개수 또는 회귀 문제의 출력 차원과 동일 동작 방식순전파 (Foward Propagation)입력 데이터 → 각 층의 뉴런 활성화 → 최종..

⊢ DeepLearning 2025.03.19

딥러닝 실습 환경 구축

Conda&Jupyter Notebook을 이용한 환경 설정, 가상환경 설치 및 Jupyter Notebook 연결  https://s2bibiprincess.tistory.com/68 Python - Pandas설치 및 Conda, Jupyter Notebook, 가상환경과 kernelPandas 설치pip install pandas   Jupyter Notebook 코드, 텍스트, 이미지 등을 한 곳에서 관리할 수 있는 대화형 컴퓨팅 환경데이터 분석, 머신러닝, 교육 등 다양한 분야에서 사용오픈 소스 웹 애플리케s2bibiprincess.tistory.com PyTorch Facebook에서 개발한 오픈 소스 딥러닝 라이브러리동적 계산 그래프(dynamic computationg graph) 지원 →..

⊢ DeepLearning 2025.03.18

신경망의 기본 원리 - 퍼셉트론과 다층 퍼셉트론

인공신공망의 기본 단위 : 퍼셉트론 단일 퍼셉트론 https://s2bibiprincess.tistory.com/168 Perceptron(퍼셉트론)Perceptron(퍼셉트론)  인공 신경망(Artificial Neural Network, ANN)의 가장 단순한 형태로, 인공 뉴런 모델 중 하나이진 분류 문제를 해결하기 위해 설계된 알고리즘으로, 입력 데이터를 받아 두 개의 클s2bibiprincess.tistory.com  단순 퍼셉트론은 선형 분류만 가능하며, 비선형 문제(XOR 등)는 해결할 수 없음  다층 퍼셉트론(MLP)과 XOR 문제 해결  다층 퍼셉트론(MLP, Multi-Layer Perceptron, MLP) 은닉층이 추가되면서 신경망이 비선형성을 학습할 수 있게 되며, 단순 퍼셉트론으..

⊢ DeepLearning 2025.03.18

Deep Learning

딥러닝(Deep Learning) 인공신경망(Artificial Neural Networks, ANN)을 기반으로 한 기계 학습(Machine Learning)의 한 분야 여러 층(layer)으로 구성된 신경망을 통해 데이터에서 중요한 특징을 자동으로 학습하고, 합습을 바탕으로 예측, 분류, 생성 등의 다양한 작업을 수행기존 머신러닝과 달리 특징 공학(feature engineering)과정이 필요 없이, 데이터로부터 직접 패턴을 학습 비선형 추론 가능 : 다층 구조를 활용해 복잡한 데이터의 패턴 학습 가능자동 특징 추출 : 별도의 특징 엔지니어링 없이도 데이터에서 유의미한 특징을 찾아낼 수 있음대용량 데이터 학습 : GPU연산을 활용하여 대량의 데이터를 빠르게 처리하고 학습 가능다양한 응용 가능 : 이..

⊢ DeepLearning 2025.03.18

확률과 확률 분포

확률 특정 사건이 발생할 가능성0에서 1 사이의 값을 가짐  확률 값의 의미0: 불가능한 사건1: 반드시 발생하는 사건 확률의 기본 법칙 덧셈 법칙P(A or B) = P(A) + P(B) - P(A and B) 곱셈 법칙P(A and B) = P(A) * P(B|A)  확률의 활용사건 발생 가능성 계산리스크 분석 및 의사결정 트리 구성  확률 분포 데이터가 특정 확률에 따라 분포하는 형태를 의미 이항분포(Binomial Distribution) 성공/실패와 같은 두 가지 결과를 가지는 실험을 n번 독립적으로 수행하는 확률 분포 각 시행에서 성공 확률 p가 일정함성공 횟수를 X라 할 때, X는 이항분포를 따름: X ~B(n, p)평균: np, 분산: np(1-p)예동전 던지기제품의 불량 개수 예측 정규분..

데이터 상관관계

데이터 상관관계 두 변수 간의 관계의 강도와 방향을 나타냄→ 연구 가설을 형성하는 데 도움을 줄 수 있음 상관관계 분석과 데이터 분산의 이해분산의 영향 이해데이터의 분산이 크면 상관관계의 강도에 영향을 줄 수 있음예 : 공부 시간과 시험 점수 간의 관계 → 공부 시간의 분산이 크면 상관관계가 약해질 수 있음 시각화 활용산점도를 통해 데이터의 분포와 분산을 시각적으로 확인하여 변수 간의 관계와 데이터의 퍼짐 정도를 파악할 수 있음 표준화 고려변수들의 척도가 다를 경우, 데이터를 표준화하여 분산의 영향을 줄일 수 있음표준화를 통해 변수 간 비교를 더 공정하게 할 수 있음 적절한 상관계수 선택데이터의 특성에 따라 피어슨 상관계수와 스피어만 상관계수 중 적절한 것을 선택비선형 관계나 정규성 가정이 충족되지 않는..

데이터 산포도

데이터 산포도 데이터가 중심 경향치로부터 얼마나 퍼져 있는지를 나타내는 지표데이터의 분포와 변동성을 파악하는데 중요한 역학을 함  분산과 표준편차 분산(Variance)데이터가 평균으로부터 얼마나 퍼져있는지를 나타내는 지표    σ² = Σ(x - x̄)² / N 또는   $$ \sigma^2 = \bar{x^2} - \bar{x}^2 $$">$$ \sigma^2 = \bar{x^2} - \bar{x}^2 $$각 데이터 포인트와 평균의 차이를 제곱한 값들의 평균 장점 : 모든 데이터 포인트를 고려하여 변동성을 정확히 측정 가능단점 : 원래 데이터 단위와 다른 단위(제곱된 단위)를 가지므로 해석이 어려울 수 있음활용 예 : 금융 리스크 분석, 품질 관리, 데이터 변동성 평가   분산식에서 제곱이 갖는 의..

데이터 중심 지표- 평균(산술평균, 기하평균), 중앙값, 최빈값

데이터 중심 지표는 데이터셋의 전반적인 특성을 요약하고, 데이터의 패턴을 이해하는 데 사용됨 평균(Mean) 데이터의 중심 경향을 나타내는 대표적 지표일반적으로 데이터의 대표값으로 사용됨 산술평균(Arithmetic Mean) 모든 값을 더한 후 값의 개수로 나눈 값가장 일반적인 평균의 개념 x̄ = (x₁ + x₂ + ... + xₙ) / n 계산이 간단하고 직관적데이터 전체를 고려하여 대표값을 제시극단값(이상치, outlier)에 민감사용 예 : 학생들의 평균 점수, 평균소득, 평균 온도 등  기하평균(Geomertic Mean) 모든 값을 곱한 후 값의 개수만큼 제곱근을 취한 값주로 비율이나 변화율이 포함된 데이터에서 사용 G = ⁿ√(x₁ ∙ x₂ ∙ ... ∙ xₙ) 극단값의 영향을 줄일 수 있..

AI/ML/DL

AI (Artificial Intelligence, 인공지능) 인간처럼 사고하고 문제를 해결하며 학습하는 능력을 가진 시스템을 만드는 학문 또는 기술 가장 광범위한 개념으로, 인간의 지능을 모방하려는 모든 기술을 포함 • 규칙 기반 시스템 (예: 체스 프로그램) • 전문가 시스템 (지식 기반 추론 시스템) • 머신 러닝과 딥러닝 모두 AI의 하위 집합 ML (Machine Learning, 기계 학습) AI의 하위 집합으로, 명시적으로 프로그래밍하지 않고 데이터에서 학습하여 성능을 개선하는 기술 • 데이터를 분석해 패턴을 찾고, 이를 기반으로 미래 데이터를 예측하거나 분류 • 지도 학습, 비지도 학습, 강화 학습 등으로 나뉨 • 사람의 개입 없이도 데이터에서 학습 가능 • 모델의 성능은 주로 입력 ..

Python to AI 2024.12.24
728x90