我有一个文件,其中包含许多领域,其中之一是country
。 有与同许多文件country
。
当我做match query
,或fuzzy
对搜索country
,并查询Belgium
为例,它返回的文件,这些文件匹配列表Belgium
的国家,但他们都有不同的分数。 我相信这是因为tdidf的相似性和存在的belgium
中的文档等领域,期限等。
我想它返回相同的分数在这种情况下。 我应该使用什么相似之处吗?
更新
我有未来6个文件:
{country:"Austria", title: "house"}
{country:"Austria", title: "Austria village"}
{country: "Germany", title: "deutch hotel" }
{country:"Austria", title: ""}
{country: "USA", title: "Usa hotel" }
{country: "USA", title: "Usa another hotel" }
当我执行匹配查询对国家:
{
query: {match: {country: "Austria"}}
}
我reveice未来的结果:
[ {
"_index" : "elasticdemo_docs",
"_type" : "doc",
"_id" : "1",
"_score" : 1.0, "_source" : {country:"Austria", title: "Austria village"}
}, {
"_index" : "elasticdemo_docs",
"_type" : "doc",
"_id" : "2",
"_score" : 0.30685282, "_source" : {country:"Austria", title: "house"}
}, {
"_index" : "elasticdemo_docs",
"_type" : "doc",
"_id" : "3",
"_score" : 0.30685282, "_source" : {country:"Austria", title: ""}
} ]
我想收到相同_score
所有3个文件,因为它们都具有Austria
作为一个国家。 我应该使用什么相似之处吗?