37channel/news-dataset-20240506-g-rss-step-4-debug-1
收藏Hugging Face2024-06-25 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/37channel/news-dataset-20240506-g-rss-step-4-debug-1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,包括标题、内容、日期、URL等,数据类型主要为字符串和整数。数据集目前仅包含训练集,训练集大小为1497864字节,包含425个样本。数据集的下载大小为861591字节,总大小为1497864字节。
The dataset contains multiple fields, including title, content, date, URL, etc., with data types primarily being strings and integers. The dataset currently only includes a training set, with a size of 1497864 bytes and 425 samples. The download size of the dataset is 861591 bytes, and the total size is 1497864 bytes.
提供机构:
37channel
原始信息汇总
数据集概述
数据集特征
- after_inf_title2context_1: 字符串类型
- before_inf_title2context: 字符串类型
- content: 字符串类型
- date: 字符串类型
- interested-llm: 字符串类型
- step: 字符串类型
- title: 字符串类型
- url: 字符串类型
- index: 整数类型
数据集分割
- train:
- 样本数量: 425
- 数据大小: 1497864 字节
数据集大小
- 下载大小: 861591 字节
- 数据集大小: 1497864 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



