five

PcMSP

收藏
arXiv2022-10-22 更新2024-06-21 收录
下载链接:
https://github.com/Xianjun-Yang/PcMSP
下载链接
链接失效反馈
官方服务:
资源简介:
PcMSP数据集由加州大学圣巴巴拉分校创建,专注于从多晶材料合成过程文本中提取科学行动图。该数据集包含从305篇开放获取科学文章中提取的合成句子、实体提及和句子内关系,通过两步人工标注和标注者间一致性研究确保高质量。PcMSP旨在支持可重复研究、机器自动化和材料预测,通过提供详细的合成过程信息,解决材料科学领域信息提取的挑战。

The PcMSP dataset, created by the University of California, Santa Barbara, focuses on extracting scientific action graphs from texts related to polycrystalline material synthesis processes. This dataset includes synthesis sentences, entity mentions, and intra-sentence relationships extracted from 305 open-access scientific articles. Its high quality is ensured via two-step manual annotation and an inter-annotator agreement study. Designed to support reproducible research, machine automation, and materials prediction, the PcMSP dataset addresses the challenges of information extraction in the materials science domain by providing detailed synthesis process information.
提供机构:
加州大学圣巴巴拉分校
创建时间:
2022-10-22
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作