相似度算法可以按字段指定,只需在映射中为不同字段选定即可:
PUT /my_index
{
"mappings": {
"doc": {
"properties": {
"title": {
"type": "string",
"similarity": "BM25" (1)
},
"body": {
"type": "string",
"similarity": "default" (2)
}
}
}
}
-
title
字段使用 BM25 相似度算法。 -
body
字段用默认相似度算法(参见 实用评分函数)。
目前,Elasticsearch 不支持更改已有字段的相似度算法 similarity
映射,只能通过为数据重新建立索引来达到目的。
配置相似度算法和配置分析器很相似,自定义相似度算法可以在创建索引时指定,例如:
PUT /my_index
{
"settings": {
"similarity": {
"my_bm25": { (1)
"type": "BM25",
"b": 0 (2)
}
}
},
"mappings": {
"doc": {
"properties": {
"title": {
"type": "string",
"similarity": "my_bm25" (3)
},
"body": {
"type": "string",
"similarity": "BM25" (4)
}
}
}
}
}
-
创建一个基于内置
BM25
,名为my_bm25
的自定义相似度算法。 -
禁用字段长度规范化(field-length normalization)。参见 调试 BM25 。
-
title
字段使用自定义相似度算法my_bm25
。 -
字段
body
使用内置相似度算法BM25
。
Tip
|
自定义的相似度算法可以通过关闭索引,更新索引设置,开启索引这个过程进行更新。这样可以无须重建索引又能试验不同的相似度算法配置。 |