让我们假设一个用户投票为1〜5。这些电影一定规模的电影有流派的信息,和电影可以有不止一个流派。 像这样:
Movie A Rating 4
Action/Sci-Fi
Movie B Rating 5
Comedy/Action
Movie C Rating 4
Comedy/Drama
我们想了解哪些流派喜欢我们的用户。 在这里,我们有我们的结果集:
Genre Movie_Count Average_Rating
----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4
显然,我们无法预测这样的结果集小东西,但让我们假设,我们已经一个更大的数据集。
利用这些数据,我们怎么能排序最喜欢这个用户的类型? 简单地计算加权平均或更复杂的东西?