事件抽取数据集
收藏国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64edc996bb16e07753c35c75&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集是一个文本数据集,用以训练从中文新闻概要中提取主要事件的机器学习网络模型。数据集包含财经、司法、体育、组织新闻等9个类别的新闻文本,单个类别以json格式文件存储,文件包含该类别下所有新闻和对应的事件抽取结果,使用者可以自行划分训练集、验证集和测试集,数据实体文件大小总计15.3 MB。
This is a text dataset intended for training machine learning network models that extract core events from Chinese news summaries. The dataset covers 9 categories of news texts including finance, judicial, sports, and organizational news. Each individual category is stored in a JSON-format file, which contains all the news items under this category and their corresponding event extraction results. Users can independently split the dataset into training, validation and test subsets. The total file size of all data entities in this dataset is 15.3 MB.
提供机构:
成都索贝数码科技股份有限公司
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于训练中文新闻事件抽取模型的数据集,包含财经、司法、体育等9个类别的新闻文本,以json格式存储,总大小为15.3 MB。使用者可自行划分训练集、验证集和测试集。
以上内容由遇见数据集搜集并总结生成



