-
openrag_base
Open RAG Base 是一个基于公开资料收集整理汇总的RAG知识库。它基于Notion构建,是目前最全面RAG的资料汇总仓库。目的是为读者提提供前沿和全面的RAG知识,提供多维度的分析汇总,涵盖RAG的方方面,包括: 学术论文 前沿阅读资料 RAG评估与基准 下游任务与数据集 工具与技术栈 研究学者和机构 -
使用Lean 4 的Mathlib 库的数学知识图谱
Lean 4 是一种计算机辅助证明系统(proofassistant),或称交互式证明系统 (in teractive theorem prover),可用于形式化验证数学定理或计算机程序的正确性。 Mathlib 是 Lean 4 的数学库,它背后有一个活跃的开发团队,包括许多数学家... -
GuwenEE:细粒度古汉语事件抽取数据集
面向古汉语领域事件抽取的数据集,原始数据是从《二十四史》中按篇随机选取而来,包含语料950条,事件Schema72个,包含事件1826个。 -
基于cnScheme的外国文学研究领域知识图谱
基于开放域数据CNKI的12833 篇研究文献作为语料来源,将文献中的关键词作为主题关键词,作者作为研究人员。通过爬虫爬取结构化数据作为知识图谱基本数据,结合爬取一些自然语言数据与半结构化数据,并进行语义抽取构建了外国文学研究领域的核心数据 在上述基础上,我们进行了实体对齐与部分的实体消歧,比如译名的对齐:列夫·托尔斯泰 和 托尔斯泰... -
author_article_school
从知网下载的4000条左右的论文数据集,总共三个实体 作者(author_id,name) 论文(article_id,summary,urls,year,article_name,cite,down) 就读高校(school_id,school_name) 关系:write_to,graduate_to 可以直接导入Neo4j使用 -
GAKG: 地学多模态学术知识图谱
GAKG 是⼀个⼤型多模态学术知识图谱,Acemap研究团队背靠DDE项目设计了一个新颖的地球科学多模态学术知识图谱GAKG,其中所有的数据均来⾃ AceMap (https://www.acemap.info/ ),希望能为地学领域、数据挖掘和信息检索领域的研究者们提供数据和服务。 -
XBMU-QandA
西北民族大学问答信息 -
MOOPer数据集
本数据集由CCKS2021论文“MOOPer:A Large-scale Dataset of Practice-oriented Online Learning” 发布。本文档对数据集内数据字段含义进行详细介绍,其他信息可参考原文获取。 点击此处下载MOOPer数据集 什么是MOOPer?... -
CSDQA: 计算机科学领域示意图问答数据集
CSDQA (Computer Science Diagram Question... -
2020年中国排名前一百大学知识图谱
本项目是根据2020年校友会发布的中国前一百大学排行榜来获取中国百强大学的相关信息。提取的主要信息包括有大学的中文英文名称,大学的缩写,大学所属的类型,大学的主管部门和创办时间等等。... -
论文知识图谱
Semantic Scholar数据集的知识图谱,展示了论文、论文作者、论文类别之间的关系。 -
基于COVID-19论文集的学术知识图谱
基于COVID—19论文数据集的COVID-19学习论文知识图谱是我们云南省高校数据科学与智能计算重点实验室与美国知名高校佐治亚大学的刘天明教授合作研究的成果。... -
《知识图谱》书籍资源汇总
《知识图谱 方法、时间与应用》书籍资源汇总 -
OpenKG论文浅尝2019年论文汇编
OpenKG「论文浅尝」旨在通过分享近期知识图谱领域的论文笔记,内容涉及信息抽取、知识推理、知识问答、推荐系统、知识融合等多个方向。2019年共推送 90 篇「论文浅尝」,这本论文汇编是根据文章阅读量挑选出的其中20+篇笔记。 特别感谢:整理「论文浅尝」笔记的来自浙江大学、东南大学、南京大学、天津大学、复旦大学的 40 多位同学。 -
人工智能领域专利库
关于人工智能领域的专利知识库,通过该专利数据,可以更全面的了解AI的研发趋势和规律,从而为创新指路。 介绍 关于人工智能领域的专利知识库,通过该专利数据,可以更全面的了解AI的研发趋势和规律,从而为创新指路。 字段 abstract| 摘要 apdt|申请日 apno| 申请号码 assignee|专利权人信息 claim|权利要求 cpc|分类号信息... -
清华大学-科技知识图谱
... -
机器之心开放人工智能词库
作为最早关注人工智能技术的媒体,机器之心在编译国外技术博客、论文、专家观点等内容上已经积累了超过两年多的经验。期间,从无到有,机器之心的编译团队一直在积累专业词汇。虽然有很多的文章因为专业性我们没能尽善尽美的编译为中文呈现给大家,但我们一直在进步、一直在积累、一直在提高自己的专业性。...