基于相似的百分比分组(Grouping Based on Similarity in Percent

2019-09-30 04:50发布

我有一个表,看起来像这样:

username | privilges 
user1       privilge1
user1       privilge2
user1       privilge3
user2       privilge1
user2       privilge5
user2       privilge3
etc ......

我想基于百分比到其他用户的相似组privliges。 例如在表中:
user1和user2仅具有2在共同的(privilge1,privilge3)privilges其是66%。 所以如果我在priviges寻找相似之处基于超过50%,它会喜欢这个组是:

user1  : privilge1 ,privilge3
user2  : privilge1 ,privilge3
文章来源: Grouping Based on Similarity in Percentage