five

OA-STM Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/elsevierlabs/OA-STM-Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了来自10个领域的科学论文摘要,这些摘要已经过预处理,并且核心科学概念已经得到标注。具体来说,每个摘要都标注了四个核心科学概念:过程、方法、材料和数据。任务是对Dke提取器进行微调,以适应不同的领域。

This dataset contains scientific paper abstracts spanning 10 distinct domains. Each abstract has been preprocessed, and its core scientific concepts have been annotated. Specifically, four core scientific concepts are labeled for every abstract: Process, Method, Material, and Data. The corresponding task is to fine-tune the Dke Extractor to adapt to various domains.
提供机构:
Elsevier Labs
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作