数据集 关于 活动流 排序 相关度 按名称升序 按名称降序 最后修改时间 热门 Go 找到1个数据集 标签: 中文分词 过滤结果 THULAC:清华大学中文词法分析工具包 THULAC(THU Lexical Analyzer for Chinese)由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包,具有中文分词和词性标注功能。THULAC具有如下几个特点: 能力强。利用我们集成的目前世界上规模最大的人工分词和词性标注中文语料库(约含5800万字)训练而成,模型标注能力强大。... c/c++