딥러닝 학습전략

딥러닝 학습전략

2023. 3. 29. 14:12ㆍ_Study/AI

728x90

#0329

Vanisihing gradient problem과 해결책

ReLU 함수를 사용하여 해결

- gradient가 0에 가까워지면 (미분하다보면 0에 가까우면) weight가 안바뀌는 문제 발생

loss function : 손실함수

과잉 적합과 과잉 적합 회피 전략

- 너무 작은 차수(1차 다항식)를 사용하면? -> underfitting:과소 적합 (데이터에 비해 모델 용량이 작은 상황)

- 모든 점을 고려하면 training set에는 완벽할 수 있으나 모르는 샘플에 대해 극단적인 현상 발생

과잉 적합 회피 전략

- 데이터 양을 늘림

- 데이터의 양을 늘릴 수 없는 상황에서는 훈련 샘플을 변형하여 인위적으로 늘리는 데이터 증대(data augmetation) 사용

딥러닝이 사용하는 손실함수

- 시험 점수의 역할

: 점수가 낮은 학생에게 패널티를 주어 동기부여

: 그러나 점수가 낮거나 높거나 비슷한 벌점을 받으면 공정성이 깨지고 공부 의욕을 꺾음

이는 신경망 학습도와 비슷하다.

신경망 가중치 : 학생, 손실 함수: 시험 점수

MSE(평균제곱오차)

문제점

- 교정에 사용하는 값, 즉 gradient가 벌점

- 오차 e가 더 큰데 gradient가 더 작은 상황이 발생하면

- 학습이 느려지거나 학습이 안되는 상황을 초래할 가능성 발생

교차 엔트로피

엔트로피 entropy

: 확률 분포의 무작위성(불확실성)을 측정하는 함수

교차 엔트로피 cross entropy

두 확률 분포 P와 Q가 다른 정도를 측정하는 함수

모멘텀을 이용한 gradient 감소

참고 : 파이썬으로 만드는 인공지능

seed값을 고정하여 비교

error 가 날 경우 삭제, or CPU로

저작자표시 동일조건

'_Study > AI' 카테고리의 다른 글

[인공지능] chatgpt를 활용한 기계 학습과 인식1 #AI #SVC #SVM #chatgpt (0)	2023.04.05
[인공지능] CNN(Convolution neural network)2 #CNN (0)	2023.04.05
[인공지능] Intro to AI, MIT OCW 2021, 머신러닝 모델 3가지 (0)	2023.04.03
[인공지능] 인공지능의 기초 #인공지능 #overview (0)	2023.04.03
[인공지능] CNN (1) (0)	2023.03.31

cross_stITch

cross_stITch

태그

최근글

댓글

공지사항

아카이브

Vanisihing gradient problem과 해결책

과잉 적합과 과잉 적합 회피 전략

MSE(평균제곱오차)

교차 엔트로피

'_Study > AI' 카테고리의 다른 글

관련글

티스토리툴바