은닉 구조

우선 말해두겠지만, 아마 이 은닉 구조는 우선 우리가 쓸 일이 별로 없을 것이다. 하지만 이런 것도 있다~ 는 알아두는 것이 좋다고 생각한다.

우리 동아리원 (이은찬, 배주웅, 박유택, 천주형, 이효건, 김현성) 여섯 명이 영화에 대한 평점을 다음 표와 같이 내렸다.(평점은 0~3까지다)

우선, 영화의 장르 분류는 다음과 같다.

장르 트루먼 쇼 존 윅 러브라이브 투사부일체
드라마 O X O X
범죄 X O O O
코미디 X X X O

그리고 준 별표는 다음과 같다.

분류 트루먼쇼 존 윅 러브라이브 투사부일체
이은찬 1 0 1 0
천주형 0 2 2 2
배주웅 0 0 0 1
박유택 1 2 3 2
이효건 1 0 1 1
김현성 0 2 2 3

이를 행렬로 나타내면 왼쪽 행렬과 같고, 그를 행렬 곱으로 표현하면 다음과 같다.

-

  1. 첫번째 행렬이 의미하는 바는 사람들의 선호하는 장르이다. 첫번째줄의 은찬이는 드라마 장르를 선호하고, 네번째 줄의 유택이는 드라마와 범죄 장르를 선호하는 것을 알 수 있다.
  2. 가운데 행렬이 의미하는 바는 장르가 선호도에 미치는 가중치를 의미한다. 가운데, 범죄라는 장르가 미치는 영향이 다른 장르에 비해서 두배 가량 된다는 것을 알 수 있다.
  3. 세번째 행렬이 의미하는 바는 이 영화가 가지는 장르이다.

이렇게 분류하면 데이터가 가지는 숨은 값을 나타낼 수 있다는 것이 장점이다. 나중에 좀 더 자세히 다루도록 할 테니 이렇게 나타내면 이런 이점이 있을 수 있구나!라는 것만 알아두자.

results matching ""

    No results matching ""