점점 더 많은 요소들을 향하여
Features를 요소이라 번역했다.
위의 예시에서는 두가지 분류에 대해 배웠다. 일종의 흑백 논리, 옳다 아니면 그르다. 세상이 그렇게 쉽게 분류되면 좋겠지만 언제나 현실은 더욱 가혹하다. 두가지 분류가 아닌 그 이상의 분류로 나눌 때가 오기 마련이다. 좋은놈, 나쁜놈, 그리고 이상한 놈! 이제, 좋은놈, 나쁜놈 뿐만 아니라 이상한 놈까지 찾아보자.
이전에 우리가 했던 비용함수는 한가지 요소만 사용했고, 한가지 변수만 사용했을 때의 비용 함수에 대해서 알아보았다.
상황 : 공부를 해도 수학 등수가 오르지 않는 정현이는 대체 어떤 요소가 내 성적과 관련이 있는지 궁금해하기 시작했고, 학교 아이들의 정보를 모으기 시작했다.
IQ | 모의고사 수학 표준점수 |
---|---|
93 | 105 |
121 | 120 |
130 | 131 |
97 | 119 |
... | ... |
한가지 요소를 가진 데이터의 비용 함수
하지만, 서론에서 말했듯이, 세상은 그렇게 호락호락 하지 않다. 만약, 예측을 위한 정보의 종류가 2개 이상이라면?
하루 평균 수학 공부 시간 | 입학 등수 | IQ | 모의고사 수학 표준점수 |
---|---|---|---|
108 | 58 | 93 | 105 |
123 | 50 | 121 | 120 |
89 | 88 | 130 | 130 |
150 | 33 | 97 | 131 |
... | ... | ... | ... |
생각만 해도 복잡해 보이지만, 할 수 있다! 실상활에서 적용해보려면 이런 것이 필요하지 않겠는가. 이제 이런 2개 이상의 요소로 이루어진 데이터 셋이 입력되었을 때, 어떤 비용 함수를 가지게 될까?를 알아볼 것이다.