添加同义词之后，ik_smart 返回 ik_max_word 的分词 #1032

LvChengbin · 2023-11-21T12:42:10Z

我自定义了两个 analyzer，一个使用 ik_max_word 最为 tokenizer，另一个使用 ik_smart 作为 tokenizer，其他设置完全相同，大概如下：

{
    analyzer : {
            ik_analyzer_synonyms_max_word : {
                type : 'custom',
                tokenizer : 'ik_max_word',
                filter : [
                    'ik_synonyms_graph_filter'
                ]
            },
            ik_analyzer_synonyms_smart : {
                type : 'custom',
                tokenizer : 'ik_smart',
                filter : [
                    'ik_synonyms_graph_filter'
                ]
            }
    }
}

对于同一个 Query，ik_smart 和 ik_max_word 的分词结果是差别很大的，但是使用我上面定义的两个 analyzer 时，分词结果是相同的，看起来都是使用 ik_max_word 分词之后再映射的同义词。

是我的配置有问题么？

=================

补充一下，不完全一样，使用 ik_smart 的分词结果还是更精炼一些，但是还是把一些词给分的更细了，暂时没看出来到底是什么逻辑。

The text was updated successfully, but these errors were encountered:

kin122 · 2024-07-29T11:56:17Z

smart是把max中会有位置（文本内容）重复的词项在候选词项中去掉，获取一组位置不重复且长度更平均的词元

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

添加同义词之后，ik_smart 返回 ik_max_word 的分词 #1032

添加同义词之后，ik_smart 返回 ik_max_word 的分词 #1032

LvChengbin commented Nov 21, 2023 •

edited

Loading

kin122 commented Jul 29, 2024

添加同义词之后，ik_smart 返回 ik_max_word 的分词 #1032

添加同义词之后，ik_smart 返回 ik_max_word 的分词 #1032

Comments

LvChengbin commented Nov 21, 2023 • edited Loading

kin122 commented Jul 29, 2024

LvChengbin commented Nov 21, 2023 •

edited

Loading