光电催化材料领域语料库-金标准语料库
收藏国家基础学科公共科学数据中心2025-12-27 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=694d5f94195d267d977c613f&type=1
下载链接
链接失效反馈官方服务:
资源简介:
光电催化材料领域金标准语料库主要面向光电催化材料领域实体与关系识别研究、高精度模型训练需求建设,基于国家纳米科学中心 AutoDive 标注软件标注产生,主要记录了参照材料本体库标注的光电催化材料领域语料、实体及关系信息。
光电催化材料领域金标准语料库有领域专家标注,参考光电催化材料本体库中的知识体系设计,通过专家标注的方式从文本中标注出知识实体,字段包括doi、发表日期、文献题目、实体内容、实体类别、来源文本。
The gold-standard corpus for the photocatalytic materials field is constructed to support entity and relation extraction research and high-precision model training in this domain. It was generated via annotation using the AutoDive annotation software developed by the National Center for Nanoscience and Technology, and primarily records corpus, entities and relational information in the photocatalytic materials field annotated against the material ontology.
This gold-standard corpus is manually annotated by domain experts, with its design grounded in the knowledge framework of the photocatalytic materials ontology. Knowledge entities are extracted from source texts through expert annotation, and each entry in the corpus includes the following fields: DOI, publication date, literature title, entity content, entity category and source text.
提供机构:
中国科学院计算机网络信息中心
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个光电催化材料领域的金标准语料库,专为实体与关系识别研究及高精度模型训练而构建。它基于领域专家标注,参考了光电催化材料本体库的知识体系,包含doi、发表日期、实体内容等多类字段,数据格式为csv和docx,总数据量为2.92MB。
以上内容由遇见数据集搜集并总结生成



