清华大学 - 机构 - 开放知识图谱

KB2E: 清华大学知识图谱embedding工具包

此工具包中实现了目前效果较好的知识表示学习的方法，包括TransE, TransH, TransR and PTransE等，并且已在数据集FB15K和WN18上测试。
- c/c++
- PDF
THULAC：清华大学中文词法分析工具包

THULAC（THU Lexical Analyzer for Chinese）由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包，具有中文分词和词性标注功能。THULAC具有如下几个特点：能力强。利用我们集成的目前世界上规模最大的人工分词和词性标注中文语料库（约含5800万字）训练而成，模型标注能力强大。...
- c/c++

找到2个数据集