-
知码大模型(KnowCoder):统一信息抽取大模型
知码大模型是面向知识图谱构建的大语言模型,其通过形式化编程语言统一表示结构化知识,包括本体知识、实例知识等。通过将知识抽取转化为代码生成任务,在统一信息抽取方面取得了显著突破。... -
OneKE: 中英双语知识抽取大模型
OneKE是由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架,具备中英文双语、多领域多任务的泛化知识抽取能力,并提供了完善的工具链支持。OneKE以开源形式贡献给OpenKG开放知识图谱社区。... -
支持中文的deepdive:斯坦福大学的开源知识抽取工具(三元组抽取)
deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 。本项目修改了自然语言处理的model包,使它支持中文,并提供中文tutorial。后续将持续更新一些针对中文的优化。 -
Deepdive:完善的知识抽取框架
OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。Deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 ,可以判断两个实体间是否存在指定关系。具有较强的灵活性,可以自己训练模型。 -
OLLIE:开放三元组知识抽取
OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。OLLIE和Reverb类似,都是华盛顿大学研发的知识库KnowItAll的三元组抽取组件,OLLIE是第二代提取系统。Reverb的抽取建立在文本序列上,而OLLIE则支持基于语法依赖树的关系抽取,对于长线依赖效果更好。 -
Wandora:知识抽取可视化工具
OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。wandora是封装好的知识抽取桌面程序,支持主题图、RDF、OBO等多种输入输出格式。它内置了http服务器,有完整的交互界面,支持输出可视化。 -
SOFIE: 抽取链接本体及本体间关系
OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。SOFIE是一个自动化本体扩展系统,由max planck institute开发。它可以解析自然语言文件,从文本中抽取基于本体的事件,将它们链接到本体上,并基于逻辑推理进行消歧。 -
Reverb: 开放三元组抽取
OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。 Reverb是华盛顿大学Turing center研发的开放三元组抽取工具,可以从英文句子中抽取形如(augument1, relation, argument2)的三元组。它不需要提前指定关系,支持全网规模的信息抽取。目前用于华盛顿大学开发的knowitall知识库系统。