-
Simsearch:基于字面相似度的文本搜索引擎
simsearch 基于字面相似度的搜索引擎 一个计算多个句子单字相似集合的搜索工具.对倒排索引结果进行二次排序,采用杰卡德相似度。 作为应用在问答系统中的组件。并返回相似性打分值。假设配置了问题 ABCDFG 但是用户输入的内容是ABDG 则输出配置里最相近的n条。 1.支持错字,少字,或多了字的搜索。 2.支持多用户 3.支持单条删除或新加索引... -
segmeaning
segmeaning-中文语义相似度计算程序 计算句子和句子,句子和词,词和词之间相似度的程序,perl语言编写。自带切词组件。可以排序输出N个候选词/句子中与输入词/句字 语义最相近的M句。 基于词嵌入,计算句子词袋及单个词之间余弦距离。 比如,莲花距离植物,奔驰(汽车品牌)与汽车,奥巴马与政治等等中文词。 比较多个词之间距离远近。...