five

中文新闻文本数据[数据堂]

收藏
OpenDataLab2023-08-10 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang_NexData1
下载链接
链接失效反馈
官方服务:
资源简介:
新闻类内容数据总计约35G左右;每个新闻类内容包含ID、时间、新闻标题及新闻内容;该数据可用于大型语言模型(LLM)训练、chatgpt等任务

The total volume of news-related content dataset is approximately 35 GB. Each news entry includes an ID, timestamp, news title, and news content. This dataset can be used for tasks such as large language model (LLM) training and ChatGPT-related tasks.
提供机构:
shujutang
创建时间:
2023-08-10
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集为中文新闻文本数据,由数据堂提供,总计约35G,包含新闻ID、时间、标题和内容。它适用于大型语言模型训练和ChatGPT等任务,但属于商业数据集,仅对企业合作购买开放。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务