dongqi-me/SciNews
收藏Hugging Face2024-05-19 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/dongqi-me/SciNews
下载链接
链接失效反馈官方服务:
资源简介:
SciNews数据集旨在促进从学术文章生成科学新闻报告的模型的开发和评估。该数据集通过将复杂的学术内容简化和总结为易于理解的叙述,弥合了复杂科学研究与公众之间的差距。它支持文本摘要、简化和科学新闻的自动生成等任务,为增强公众对科学和技术的参与提供了宝贵的资源。
The SciNews dataset is designed to facilitate the development and evaluation of models for generating science news reports from academic articles. This dataset bridges the gap between complex scientific research and the general public by simplifying and summarizing intricate academic content into accessible narratives. It supports tasks such as text summarization, simplification, and automatic science news generation, serving as a valuable resource for enhancing public engagement with science and technology.
提供机构:
dongqi-me
原始信息汇总
数据集概述
名称: SciNews
目的: 旨在促进从学术文章生成科学新闻报道的模型开发和评估,通过简化并总结学术内容,提高公众对科学技术的参与度。
任务类别:
- 总结
- 文本生成
- 文本分类
- 文本到文本生成
语言: 英语
大小类别: 10K<n<100K
许可证: cc-by-4.0
数据集详情
描述:
- 策划者: Dongqi Pu, Yifan Wang, Jia Loy, Vera Demberg,来自Saarland Informatics Campus, Saarland University, Germany的计算机科学系和语言科学与技术系。
- 资金来源: 该项目获得欧洲研究委员会(ERC)资助,属于欧洲联盟的Horizon 2020研究和创新计划(Grant Agreement No. 948878)。
数据来源:
- 存储库: 数据集及相关代码可在SciNews项目页面获取。
- 论文: 数据集详细信息见论文"SciNews: From Scholarly Complexities to Public Narratives – A Dataset for Scientific News Report Generation"。
创建过程:
- 数据收集与处理: 数据来自Science X平台,使用Selenium和BeautifulSoup等网络爬虫工具进行数据提取。
- 注释: 数据集不包含额外注释,通过自动化和人工评估确保新闻叙述与原始科学论文的相关性和质量。
使用建议: 用户应意识到数据集的局限性和偏见,特别是在开发科学新闻生成模型时,应努力解决潜在偏见,确保生成的叙述准确、公正地代表原始科学内容。
引用信息:
- BibTeX: 见README文件中的BibTeX引用格式。
- ACL: 见README文件中的ACL引用格式。
联系方式: 如有进一步疑问或问题,请联系dongqi.me@gmail.com。
搜集汇总
数据集介绍

背景与挑战
背景概述
SciNews数据集是一个用于科学新闻报告生成的资源,包含从学术文章到公共叙事的转换,支持文本摘要和生成任务。数据集基于Science X平台的内容,经过严格的质量控制,适用于非商业学术研究,并需遵守特定的使用条款。
以上内容由遇见数据集搜集并总结生成



