鸟类百科知识图谱

本项目的知识基于中国环境与发展国际合作委员会生物多样性工作组补全的《中国鸟类野外手册》 的电子版,以CHM 文件格式存储。该格式是微软于 1998 年推出的基于 HTML 文件特性的帮助文件系统,可以理解为HTML的打包文件。将CHM文件抽取出来,就能得到其中的HTML文本。 利用爬虫技术和正则表达式对HTML文本进行抽取,得到包含1251个品种的鸟包含所属目、所属科、所属属、具体描述、虹膜颜色、嘴颜色、脚颜色、叫声、分布范围、分布状况、习性、俗名的知识。

数据与资源

其他信息

价值
最近更新 十一月 24, 2021, 06:05 (UTC)
创建的 十一月 24, 2021, 06:05 (UTC)