Unsupervised Learning

Supervised Learning과는 다르게, 정답이 주어지지 않은 데이터셋을 학습시키는 행위를 뜻한다. 이 사람의 특성에 따라 해킹방어과 소속인지 웹 프로그래밍과 소속인지 찾아보려고 한다고 하면, 해킹방어과 학생은 옳고, 웹 프로그래밍 과 학생은 그르다고 표현하지는 않을 것이다. 맞나? 이 상태에서 데이터를 여러 묶음으로 묶어내는 것을 목표로 하는 학습이 바로 비지도학습이다.

간단하게 알아보기

사진 보여주기 예제로 돌아가자. 이번에는, 컴퓨터에게 사진을 주면 이것이 고양이, 개 중 어느 분류에 속하는지 파악해내는 프로그램을 Unsupervised Learning을 이용하여 구현한다고 하자. 그렇다면 다음과 같은 절차를 거친다.

  1. 고양이 사진과 개 사진을 엄청 가져다 준다.
  2. 좀 공부할 시간을 준다.
  3. 새로운 고양이 사진을 주고 이게 어느 그룹에 속하는지 물어본다.

Supervised Learning과는 다르게, 이 데이터가 무엇인지 알려주지 않고, 알아서 분류하기를 바라는 것이다. (여기서 쉽게 가질 수 있는 오해는 '고양이', '개'라는 태그를 어떻게 붙히는가에 대한 것인데, Unsupervised Learning으로는 해결하기 힘든 문제다.)

좀 더 자세히 알아보기

상황 : 디미국은 오랜 내전 중이다. 문과 파와 이과 파가 나뉘어서 싸우고 있는데, 1년에 한번, 3월 첫번째 평일에 새로운 지원군이 들어온다고 한다. 지원군의 파는 정해져 있지만, 모두가 새로운 얼굴이기 때문에 피아식별이 불가능하다는 문제가 있다. 이과 파는 진단고사와 중학교 내신 점수로 구분되지만, 실제로 그 경계가 어떻게 되는지는 아직 모른다. 똑똑한 동민이가 이 문제를 해결하고자 하는데, 다행이도 현재 이과 파의 모든 학생들이 진단고사 평균과 중학교 내신 점수를 기억하고 있었다.

당연하지만, 해킹방어과(이하 해방)은 옳고, 웹프로그래밍 과(이하 웹플)이 그른 것은 아니다! 그렇다면, 진단고사 평균과 내신 점수를 축으로 하는 그래프를 그린다면 이런식으로 그래프가 그려질 것이다. 이렇게, 정답이 주어지지 않은 것을 묶으내는 것을 비지도학습이라 명한다.

그림 3의 상태에서 그림 4처럼 요렇게 요렇게 묶어내고 싶은게 나의 마음인 것.....

results matching ""

    No results matching ""