[제로베이스 PM스쿨] 매일학습일지 #5.5

 

최근 AI가 더더욱 주목 받게 되면서 AI 추천 시스템, 초개인화 등의 키워드를 갖춘 서비스에 대해 관심이 많이 생긴다.

이러한 서비스를 가진 플랫폼의 기획자라면 반드시 해당 시스템을 알고 있어야 하기 때문에 겸사겸사 ! 알아봤다

 

오늘은 티빙 추천 시스템에 관심이 생겨서 딥하게 알아보았는데 이것에 대해서 정리해보려고한다.

아래는 티빙 추천 알고리즘인 콘텐츠 기반 필터링과 협업 기반 필터링의 정의와 장단점이다. 

 

콘텐츠 기반 필터링

  • 정의 : 아이템에 대한 프로필 데이터를 이용해 과거에 사용자가 좋아했던 아이템과 비슷한 유형의 아이템을 추천해주는 시스템
  • 장점
    • 다른 사용자들의 데이터가 없어도 추천 가능 / 추천을 제공받는 사용자의 컨텐츠 이용 데이터 있다면 필터링 가능
    • 새로 추가된 아이템, 평점이 없는 유명하지 않은 아이템, 인기가 없는 아이템도 추천 가능 / 아이템의 설명만 있다면 다양한 아이템이 후보군이 될 수 있음
    • 추천을 근거하는 설명 가능 / 아이템의 설명(feature)을 이용해 아이템 간의 유사성을 계산 하기 때문에 어떤 특징이 유사성의 근거가 되는지 파악 가능
  • 단점
    • 아이템 설명 과정에서 주관성 개입 우려 / 영화 X를 A가 "흥미진진 하다", "박진감 넘친다"고 평가했지만 B는 폭력적이라고 평가 할 수 있음
    • 사용자가 과거 좋아했던 아이템을 제공하지 않으면 추천 어려움 / 아이템의 설명만 있다면 다양한 아이템이 후보군이 될 수 있음
    • 필터 버블 (Filter Bubble) : 개인화 추천으로 생긴 정보 편식 현상으로, 사용자가 제한된 주제나 관점을 가진 정보만을 접하는 문제 발생

 

협업 기반 필터링

  • 정의 : 사용자의 아이템 간의 상호 관계를 분석하여 새로운 사용자 - 아이템 관계를 찾아주는 것으로, 사용자의 과거 경험과 행동 방식에 의존하여 추천하는 시스템
  • 장점
    • 추가적인 문맥정보들의 필요가 없어, 시작단계의 모델로 선택하기 좋음 / baseline으로 적용하고, 후에 컨텐츠 기반, 다른 딥러닝, 통계기반 모델들과 결합
    • 세린디피티(Serendipity) : 사용자가 알지못하는 다른 사용자의 행동방식에 의해 추천 받은 아이템으로, 사용자의 새로운 흥미를 발견하기 좋음
    • 도메인 지식이 필요하지 않음 : 산업에 대한 전문적 지식이 필요했던 컨텐츠 기반 필터링에 비해, 산업에 대한 깊은 이해가 없어도 구매 기록/ 평점 기록만 있다면 손쉽게 적용 가능
  • 단점
    • Cold Start Problem : 새로운 사용자나 새로운 아이템 등장 시, 기존의 관련된 경험 또는 행동 방식이 없기에 추천이 곤란해지는 문제
    • Long Tail : 전체 추천 아이템으로 보이는 비율이 사용자들의 관심을 많이 받은 소수의 아이템으로 구성되어 있는 경우 비대칭적 쏠림 현상 발생
    • 계산 효율 저하 : 계산량이 많은 알고리즘이기에, 사용자가 증가할 수록 계산 시간이 더 길어지게 되며 효율성이 저하되는 문제 발생

+ Recent posts