five

SciERC

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SciERC
下载链接
链接失效反馈
官方服务:
资源简介:
我们在科学文章中引入了识别实体、关系和共指集群的多任务设置。我们创建了SCIERC,这是一个包含所有三个任务的注释的数据集,并开发了一个名为SCIIE的统一框架,具有共享跨度表示。多任务设置减少了任务之间的级联错误,并通过共指链接利用了跨句关系。实验表明,我们的多任务模型在科学信息提取方面优于以前的模型,而无需使用任何特定领域的特征。我们进一步表明,该框架支持构建科学知识图谱,我们用它来分析信息非科学文献。

We introduce a multi-task setting for identifying entities, relations, and coreference clusters in scientific articles. We created SCIERC, a dataset annotated with all three tasks, and developed a unified framework named SCIIE that features shared span representations. This multi-task setting reduces cascading errors between tasks and leverages cross-sentence relations via coreference links. Experiments show that our multi-task model outperforms previous models in scientific information extraction without utilizing any domain-specific features. We further demonstrate that this framework supports the construction of scientific knowledge graphs, which we use to analyze information from non-scientific literature.
提供机构:
OpenDataLab
创建时间:
2022-04-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SciERC是一个专注于科学文章的多任务数据集,旨在同时支持实体识别、关系抽取和共指消解三个任务,以促进科学知识图谱的构建。该数据集由华盛顿大学于2018年发布,通过统一框架减少任务间的级联错误,并利用共指链接提升跨句关系处理能力,无需依赖特定领域特征即可在科学信息提取中取得优异性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作