티스토리 뷰

머신러닝과 딥러닝 기초학습

본 글은 '딥러닝 첫걸음'으로 학습한 내용을 요약 정리한 것이며, 나중에 써먹어야할 때 참고하기 위한 목적으로 작성됬습니다.


딥러닝은 머신러닝의 기반위에 세워진 기술이다.

딥러닝을 제대로 이해하려면 개략적으로 머신러닝 철학을 알고 있어야한다.


딥러닝은 신경망을 이용한 머신러닝 기법이다.

딥러닝과 신경망은 따로 떼어놓을 수 없다.


예제소스:http://github.com/philbooks/Deep-Learning-for-Beginners


인공지능:지능적 요소를 가진 기술 총칭

머신러닝:데이터를 이용한 모델링 기법(데이터에서 모델을 찾아내는 기법)

딥러닝:머신러닝의 일종. 많은 머신러닝 종류중 하나.


딥러닝은 머신러닝의 일종이고, 머신러닝은 인공지능의 일종이다.

인공지능 머신러닝 딥러닝의 관계


머신러닝이 모델링에 사용하는 데이터를 '학습데이터'라고한다.

모델은 그저 최종결과물이라는 뜻이라고 이해하면된다.(모델을 가설이라고도 한다.)


원래 모델링기법은 있었다. 인공지능분야 전문가를 능가하는 능력을 가진 시스템.. 등이 그예다.


그러나 영상,음성인식,자연어처리 등은 어려웠다. 머신러닝은 이런 문제처리에 효과적이다.


머신러닝은 명시적으로 모델을 구하기 어려운 문제를 해결하기 위해 개발되었다.

즉 학습된 데이터로 모델을 구하는 것이 핵심인것이다.


하지만 문제도있다.

학습 데이터와 입력데이터의 차이가 바로 머신러닝의 구조적 난제다.

딥러닝도 마찬가지다.


따라서.

머신러닝 기법을 사용할 때는 실제데이터의 특성이 잘 반영되어있고

편향되지 않은 학습 데이터를 확보하는 것이 매우 중요하다.


학습,입력 데이터가 달라도 성능에서 차이가 얼마 없게하는 것을 일반화라고한다.


과적합: 학습데이터가 모두 정답이라고 생각하고 모델을 여기저기 맞추면

일반화가 떨어지는 모델을 얻게된다. 이런 현상을 과적합이라고함.

학습데이터에만 지나치게 최적화되어 실제입력에서는 성능이 떨어지는 현상

모델구조

[과적합 문제의 해결기법]

정칙화(regularizition):모델의 성능을 약간 희생하더라고 모델을 최대한 간단하게 만들어서 과적합에 안빠지도록 하는 전략

검증(validation):학습 데이터의 일부를 따로 떼어 내서 학습에는 사용하지 않고 모델의 성능 검증용으로 사용하는 기법이다.

과적합

[검증순서]

1.학습데이터를 학습용데이터와 검증용 데이터로 나눈다. (8:2)

2.학습용데이터로 모델을 학습시킨다.

3.검증용데이터로 모델의 성능을 평가한다.(만족했다면 학습을 마친다.)

(성능이 떨어지면, 모델의 구조 등을 수정해 2단계부터 다시 수행한다.)


교차검증:검증과 같으나 검증용데이터를 무작위로 바꾼다,.


[머신러닝의 큰 3종류]

지도학습:문제를 품->교정. 지도학습에서 학습 데이터는 입력과 정답의 쌍으로 구성된다. 정답:모델이 출력해야하는 값

비지도학습:학습데이터=입력만 있고 정답은 없는 형태

강화학습:학습데이터=입력과 해당출력, 이 출력에대한 평가의 쌍


책에서는 지도학습만 배운다. 가장쓸모있고 입문할때 좋아서이다.


[지도학습]

모델의 쓰임새에 따라서.,

-

분류: 입력데이터가 어느 범주에 속하는지 판단. (스팸,비스팸/숫자/얼굴인식)

분류문제에서 학습데이터는 {입력, 해당범주}

-

회기:어떤 값을 예측한다. (나이에 따른 소득예측..)


이 둘은 정답의 형태만 다를뿐. {입력,정답} 형태가 학습데이터인것은 동일하다.


입력이 어느범주인지 판별해야한다? 분류문제

입력의 추세를 예측해야한다? 회기문제


[비지도학습 대표응용분야:군집화]

데이터의 특성분석 후 관련성있는 것들을 묶어준다.


머신러닝 성패는 얼마나 일반화를 잘 하느냐에 있다!

댓글
최근에 올라온 글
최근에 달린 댓글
네이버 이웃추가
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함