中文新闻文本数据[数据堂]
收藏OpenDataLab2023-08-10 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang_NexData1
下载链接
链接失效反馈官方服务:
资源简介:
新闻类内容数据总计约35G左右;每个新闻类内容包含ID、时间、新闻标题及新闻内容;该数据可用于大型语言模型(LLM)训练、chatgpt等任务
The total volume of news-related content dataset is approximately 35 GB. Each news entry includes an ID, timestamp, news title, and news content. This dataset can be used for tasks such as large language model (LLM) training and ChatGPT-related tasks.
提供机构:
shujutang
创建时间:
2023-08-10
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集为中文新闻文本数据,由数据堂提供,总计约35G,包含新闻ID、时间、标题和内容。它适用于大型语言模型训练和ChatGPT等任务,但属于商业数据集,仅对企业合作购买开放。
以上内容由遇见数据集搜集并总结生成



