知码大模型(KnowCoder):统一信息抽取大模型

知码大模型是面向知识图谱构建的大语言模型,其通过形式化编程语言统一表示结构化知识,包括本体知识、实例知识等。通过将知识抽取转化为代码生成任务,在统一信息抽取方面取得了显著突破。知码大模型包含大规模知码本体、海量知码训练数据以及一个两阶段的训练框架,可以提供中英双语、可泛化的知识抽取能力,可以帮助研究人员和开发者更好地完成信息抽取、数据结构化、知识图谱构建等任务。

数据与资源

其他信息

价值
https://ict-goknow.github.io/knowcoder/
作者 李紫宣, 曾宇涛, 左宇新, 任韦澄, 刘文轩, 苏淼, 郭宇璨, 刘衍涛, 李想, 胡志磊, 白龙, 李伟, 刘议丹, 杨攀, 靳小龙, 郭嘉丰, 程学旗
维护者 白龙
最近更新 五月 6, 2024, 08:59 (UTC)
创建的 五月 6, 2024, 08:33 (UTC)