清华大学 - 机构 - 开放知识图谱

清华大学-科技知识图谱

SciKG是一个以科研为中心的大规模知识图谱，目前包含计算机科学领域，由概念、专家和论文组成。其中，科技概念及其关系是从ACM计算分类系统中提取出来的，并辅以每个概念的定义（大多数来自维基百科）。...

面向知识的复杂问题推理编程语言KoPL

KoPL 全称 Knowledge oriented Programing Language...

Github

清华大学开源OpenKE: 知识表示学习平台

OpenKE 是一个开源的知识表示学习平台，由 THUNLP 基于 TensorFlow 工具包开发。在 OpenKE 中，我们提供了快速和稳定的工具包，包括最流行的知识表示学习（knowledge representation learning，KRL）方法。该框架具有容易拓展和便于设计新的知识表示学习模型的特点。该框架有如下特征： -...

Python

KB2E: 清华大学知识图谱embedding工具包

此工具包中实现了目前效果较好的知识表示学习的方法，包括TransE, TransH, TransR and PTransE等，并且已在数据集FB15K和WN18上测试。

c/c++
PDF

XLORE双语百科知识图谱

XLore从异构的跨语言在线百科中抽取结构化信息，并将其分享在网络上。据我们所知，XLore是第一个大规模的中英文知识平衡的知识图谱。目前，XLore包含__663,740__个概念，__56,449__个属性和__10,856,042__个实例。这给构建任何双语言知识平衡的大规模知识图谱提供了一种新的方式。

影视双语知识图谱

这是一个由清华大学计算机系知识工程实验室构建的完全结构化的双语影视本体，共包括23个概念，91个属性，70余万个实体以及1000多万个三元组，其数据源包括LinkedIMDB，百度百科，豆瓣等。

HTML
ttl

THULAC：清华大学中文词法分析工具包

THULAC（THU Lexical Analyzer for Chinese）由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包，具有中文分词和词性标注功能。THULAC具有如下几个特点：能力强。利用我们集成的目前世界上规模最大的人工分词和词性标注中文语料库（约含5800万字）训练而成，模型标注能力强大。...

c/c++

THUOCL：清华大学开放中文词库

THUOCL（THU Open Chinese Lexicon）是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库，词表来自主流网站的社会标签、搜索热词、输入法词库等。THUOCL具有以下特点：包含词频统计信息DF值（Document Frequency），方便用户个性化选择使用。词库经过多轮人工筛选，保证词库收录的准确性。...

TSV

找到8个数据集