프로그래밍 공부
작성일
2022. 11. 30. 10:19
작성자
WDmil
728x90

파라미터 갱신 규칙

$\theta_j = \theta_j - \alpha\frac{\partial}{\partial\theta_j} J(\theta)$ for every j

- 알파 : 학습률, 작은값으로 할당한다.

경사 하강법 알고리즘이다.

알고리즘을 계산하기 위해서는 우변에 있는 J($\theta$)계산이 필요하다.

손실함수 J에서 합을 무시하고 하나의 훈련샘플에 대한 경우:

샘플 하나에 대한학습 일 경우

확률적 경사 하강 법 이 있다.

배치 경사 하강법 이 있다.

 

훈련 데이터의 일부분, 훈련 집합 전체를 사용 등을 사용한다.

 

728x90