Nexdata/Chinese_News_Text_Data
收藏Hugging Face2024-04-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Chinese_News_Text_Data
下载链接
链接失效反馈官方服务:
资源简介:
新闻内容数据,总计约35G;每条新闻评论内容包括ID、时间、新闻标题和新闻正文;该数据集可用于LLM训练、ChatGPT等任务。数据收集时间为1991年2月1日至2017年7月,存储格式为json,语言为中文。数据量方面,中性数据不少于1.6小时,带有填充词的数据不少于0.4小时,其余六种情感数据每种不少于1.67小时。
提供机构:
Nexdata
原始信息汇总
数据集卡片 Nexdata/Chinese_News_Text_Data
描述
新闻内容数据,总计约35G;每条新闻评论内容包含ID、时间、新闻标题和新闻正文;此数据集可用于LLM训练、chatgpt等任务。
规范
数据内容
新闻内容数据
数据大小
约35G
数据字段
id, time, title, body
收集时间
1991年2月1日至2017年7月2日
存储格式
json
语言
中文
数据量
- 中性数据量不少于1.6小时
- 含填充词的数据量不少于0.4小时
- 其余六种情感数据量每种不少于1.67小时
许可信息
商业许可



