AI & 머신러닝 & 딥러닝

[딥러닝] 기본 프로세스 및 주요 용어

mle21 2022. 7. 26. 06:00
반응형

[기본 프로세스]

0단계 : 모델의 가중치, 편향을 무작위로 초기화

1단계 : 앞서 배운 인공 신경망을 통해 데이터를 입력받아 출력값/예측값 계산

2단계 : 예측값과 레이블/정답 사이의 차이를 정의하는 손실함수를 이용해 손실(loss, cost, error) 계산

3단계 : 최적화 알고리즘을 통해 손실을 최소화하는 방향으로 모델의 가중치/편향값을 수정


1. 학습(train)

상기 0단계에서 시작하여 1, 2, 3단계를 자동으로 반복하며 최적화된 모델(가중치, 편향)을 찾는 과정

2. 순전파(forward propagation)

입력층-은닉층-출력층을 거쳐 예측값을 내는 과정

3. 역전파(backward propagation)

출력층-은닉층-입력층을 거쳐 손실함수 계산 및 최적화 알고리즘을 통해 weight, bias를 업데이트하는 과정

4. 손실함수(loss function)

예측값과 정답과의 차이/오차를 구하는 함수 (일반적으로 음수/양수 말고 MSE로 절대치 구함) 비용함수(cost function)이라고도 불리며 loss는 하나의 input data cost는 모든 input dataset에 대한 오차임

5. 최적화 알고리즘(optimizer algorithm)

손실함수의 값이 가장 작게하는 weight, bias를 구하는 알고리즘

728x90