-->

寻找与评价值的用户最喜欢的项目(Finding most liked item of a user

2019-10-30 07:27发布

让我们假设一个用户投票为1〜5。这些电影一定规模的电影有流派的信息,和电影可以有不止一个流派。 像这样:

Movie A Rating 4
Action/Sci-Fi

Movie B Rating 5
Comedy/Action

Movie C Rating 4
Comedy/Drama

我们想了解哪些流派喜欢我们的用户。 在这里,我们有我们的结果集:

Genre Movie_Count Average_Rating

----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4

显然,我们无法预测这样的结果集小东西,但让我们假设,我们已经一个更大的数据集。

利用这些数据,我们怎么能排序最喜欢这个用户的类型? 简单地计算加权平均或更复杂的东西?

Answer 1:

我在这里看到的主要问题是:

用户速率1000部喜剧电影与4平均分

用户率10部动作电影与4.1平均分

你如何订购它们?

见http://www.evanmiller.org/how-not-to-sort-by-average-rating.html讨论和一个可能的解决方案。

另一个问题是:

如果影片既喜剧和动作,并给出等级4.0,多少是因为它是喜剧或动作?

你可以解决这个使用期望最大化http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm 。



文章来源: Finding most liked item of a user with rating values