은닉 구조
우선 말해두겠지만, 아마 이 은닉 구조는 우선 우리가 쓸 일이 별로 없을 것이다. 하지만 이런 것도 있다~ 는 알아두는 것이 좋다고 생각한다.
우리 동아리원 (이은찬, 배주웅, 박유택, 천주형, 이효건, 김현성) 여섯 명이 영화에 대한 평점을 다음 표와 같이 내렸다.(평점은 0~3까지다)
우선, 영화의 장르 분류는 다음과 같다.
장르 | 트루먼 쇼 | 존 윅 | 러브라이브 | 투사부일체 |
---|---|---|---|---|
드라마 | O | X | O | X |
범죄 | X | O | O | O |
코미디 | X | X | X | O |
그리고 준 별표는 다음과 같다.
분류 | 트루먼쇼 | 존 윅 | 러브라이브 | 투사부일체 |
---|---|---|---|---|
이은찬 | 1 | 0 | 1 | 0 |
천주형 | 0 | 2 | 2 | 2 |
배주웅 | 0 | 0 | 0 | 1 |
박유택 | 1 | 2 | 3 | 2 |
이효건 | 1 | 0 | 1 | 1 |
김현성 | 0 | 2 | 2 | 3 |
이를 행렬로 나타내면 왼쪽 행렬과 같고, 그를 행렬 곱으로 표현하면 다음과 같다.
-
- 첫번째 행렬이 의미하는 바는 사람들의 선호하는 장르이다. 첫번째줄의 은찬이는 드라마 장르를 선호하고, 네번째 줄의 유택이는 드라마와 범죄 장르를 선호하는 것을 알 수 있다.
- 가운데 행렬이 의미하는 바는 장르가 선호도에 미치는 가중치를 의미한다. 가운데, 범죄라는 장르가 미치는 영향이 다른 장르에 비해서 두배 가량 된다는 것을 알 수 있다.
- 세번째 행렬이 의미하는 바는 이 영화가 가지는 장르이다.
이렇게 분류하면 데이터가 가지는 숨은 값을 나타낼 수 있다는 것이 장점이다. 나중에 좀 더 자세히 다루도록 할 테니 이렇게 나타내면 이런 이점이 있을 수 있구나!라는 것만 알아두자.