找到4个数据集

授权: Creative Commons Attribution 机构: 个人 格式: CSV

过滤结果
  • 中文多模态命名实体识别数据集

    Wukong-CMNER,一个多模态NER数据集包含图像和文本的语料库。有55423个注释我们语料库中的图像-文本对。本数据是由华为发布的Wukong数据集标注得到,感谢华为公司允许对数据进行标注。
  • 郑渊洁相关

    There is no description for this dataset

  • 鸟类百科知识图谱

    本项目的知识基于中国环境与发展国际合作委员会生物多样性工作组补全的《中国鸟类野外手册》 的电子版,以CHM 文件格式存储。该格式是微软于 1998 年推出的基于 HTML 文件特性的帮助文件系统,可以理解为HTML的打包文件。将CHM文件抽取出来,就能得到其中的HTML文本。...
  • 大规模1.4亿中文知识图谱开源下载

    知识图谱可视化:https://www.ownthink.com 本次ownthink开源了史上最大规模的中文知识图谱,数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式。 使用方式见GitHub: https://github.com/ownthink/KnowledgeGraphData 下载方式:...