본문 바로가기

Prev Contents/Deep learning

[그림으로 배우는 딥러닝] 8장. 훈련과 테스팅 (267~285p)

그림으로 배우는 딥러닝 (http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791161756448&orderClick=LAG&Kc=)

 

그림으로 배우는 딥러닝 - 교보문고

◈ 이 책에서 다루는 내용 ◈ ◆ 텍스트 생성기로 이야기와 기사를 만드는 방법 ◆ 인간 게임에서 딥러닝 시스템이 승리하도록 학습하는 방법 ◆ 이미지 분류 시스템으로 사진 속 사물이나 사람

www.kyobobook.co.kr

8장. 훈련과 테스팅

훈련

전체 훈련 데이터 세트를 실행할 때마다 한 에폭 동안 훈련했다고 말한다. 일반적으로 시스템이 모든 샘플을 여러 번 볼 수 있도록 많은 에폭 동안 시스템을 실행한다.

성능 테스트

파라미터가 난수로 초기화되는 시스템으로 시작한다.

테스트 데이터

테스트 데이터에 대한 시스템의 성능이 충분하지 않다면 개선이 필요하다.
이는 일반적으로 더 많은 데이터를 수집하고 다시 훈련하는 것이 좋다. 또 다른 이점은 훈련 데이터 세트를 다양화할 수 있다는 것이다.
절대로 테스트 데이터로 학습하지 않는다. 테스트의 결과가 좋지 않다면, 무작위 값으로 초기화된 시스템으로 처음부터 다시 시작해야 한다.
실수로 테스트 데이터로 학습하는 문제는 데이터 누출, 데이터 오염, 오염된 데이터라고 한다.
일반적으로 샘플의 약 75%를 훈련 데이터 세트에 제공하도록 설정한다.
샘플은 무작위로 선택되지만 각 세트가 완벽한 입력 데이터의 근사값인지 확인하려고 할 수 있다.

검증 데이터

일반적으로 원본 데이터의 60%를 훈련 데이터 세트에, 20%를 검증 데이터 세트에, 나머지 20%를 테스트 데이터 세트에 할당해 세가지 데이터 세트를 만든다.
전체 훈련 데이터 세트로 한 에폭 동안 시스템을 훈련한 다음 검증 데이터 세트에 대한 예측을 하도록 요청해 성능을 추정한다.
검증 데이터 세트는 자동 검색 기술을 사용해 많은 하이퍼파라미터 값을 시험할 때 유용하다.

Refer 하이퍼파라미터 - 오차 발생 후 내부 값을 얼마나 업데이트해야 하는지 또는 분류기가 얼마나 복잡해야 하는지와 같이 시스템이 작동하는 방식을 제어하고자 시스템을 실행하기 전에 설정하는 변수

다양한 하이퍼파라미터를 반복적으로 시험해 검증 데이터 세트에서 어떻게 작동하는지에 따라 최적의 하이퍼파라미터를 선택할 수 있는 편리한 방법을 제공한다.
검증 데이터로 테스트를 한 분류기나 모델을 최종 모델로 선택하고 싶겠지만, 이렇게 하면 데이터 누출로 인한 왜곡된 결과를 얻게 될 것이다.

교차 검증

매번 전체 입력 데이터를 일회성 훈련 데이터 세트와 일회성 검증 데이터 세트로 분할한다.
핵심은 루프를 통해 매번 이 세트를 다르게 구성한다는 것이다.
모든 루프를 완료하면 모든 점수의 평균이 분류기의 전체 성능에 대한 추정치이다.

k-폴드 교차 검증

8장의 요약