five

抽取式摘要数据集

收藏
国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64edc997bb16e07753c35c79&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集是一个文本数据集,用以训练从中文新闻中抽取新闻摘要的机器学习网络模型。数据存储在json格式的文件中,包含“index”、“text”、“summarization”三个字段,分别对应数据编号、新闻文本和摘要抽取结果,使用者可以自行划分训练集、验证集、测试集。文件大小3.00 MB 。

This is a text dataset designed for training machine learning models to extract news summaries from Chinese news. The data is stored in JSON format files, which contain three fields: "index", "text", and "summarization", corresponding to the data serial number, news text, and summary extraction results respectively. Users can independently split the dataset into training, validation, and test sets. The file size is 3.00 MB.
提供机构:
成都索贝数码科技股份有限公司
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个用于训练中文新闻摘要抽取模型的数据集,数据以json格式存储,包含数据编号、新闻文本和摘要抽取结果三个字段。文件大小为3.27MB,适用于机器学习模型的训练和测试。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务