rnn 2

순환 신경망(Recrurrent Neural Network, RNN)

순환 신경망(Recurrent Neural Network, RNN) 시계열 데이터 및 순차적 데이터를 처리하기 위한 신경망이전 시간 단계의 정보를 현재 시간 단계로 전달하여 시퀀스 패턴을 학습 주식 가격 예측, 날씨 예측, 텍스트 생성 등에 적합  동작 원리순환 구조 : 입력 데이터와 이전 은닉 상태(hidden state)를 받아 현재 은닉 상태를 출력가중치 공유 : 모든 시간 단계에서 동일한 가중치를 사용하여 계산역전파(BPTT, Backpropagation Through Time)을 통해 학습 진행→ 과거의 정보가 너무 오래되면 영향을 거의 미치지 못하는 장기 의존성 문제(long-term dependency problem) 발생기울기 소실(Vanishing Gradient) 문제RNN의 역전파 과..

⊢ DeepLearning 2025.03.20

행렬과 행렬 연산

행렬 숫자를 직사각형 배열로 나타낸 것  m x n 행렬m개의 행(row)과 n개의 열(column)로 구성 정방행렬행과 열의 수가 같은 행렬 대각행렬주대각선(왼쪽 위에서 오른쪽 아래 방향) 외의 원소가 모두 0인 행렬 단위행렬주대각선의 원소가 1이고, 나머지 원소가 0인 특별한 대각행렬 대칭행렬전치행렬과 자신이 같은 행렬(A = Aᵀ)  행렬 연산 덧셈과 뺄셈같은 크기의 행렬에서 원소별로 수행 스칼라 곱행렬의 모든 원소에 스칼라(숫자)를 곱함 행렬 곱셈(m x n) 행렬과 (n x p) 행렬의 곱은 (m x p) 행렬 전치행과 열을 바꾸는 연산  머신러닝에서의 활용 선형 회귀 (Linear Regression)입력 데이터 (X)와 가중치 행렬 (W)의 곱을 통해 예측 (Y)을 수행Y = X•W 합성곱 ..

728x90