37channel/news-dataset-20240506-g-rss-step-1-debug-1
收藏Hugging Face2024-06-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/37channel/news-dataset-20240506-g-rss-step-1-debug-1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,如标题、内容、日期、URL等,主要用于存储与特定主题相关的信息。数据集被分为训练集,包含425个样本,总大小为1470236字节。
This dataset includes multiple fields such as title, content, date, URL, etc., primarily used for storing information related to specific topics. The dataset is divided into a training set containing 425 samples, with a total size of 1470236 bytes.
提供机构:
37channel
原始信息汇总
数据集概述
数据集特征
- after_inf_title2context_1: 数据类型为字符串。
- after_inf_title2context_{i+1}: 数据类型为字符串。
- before_inf_title2context: 数据类型为字符串。
- content: 数据类型为字符串。
- date: 数据类型为字符串。
- interested-llm: 数据类型为字符串。
- step: 数据类型为字符串。
- title: 数据类型为字符串。
- url: 数据类型为字符串。
- index: 数据类型为整数。
数据集分割
- train: 包含425个样本,总大小为1471187字节。
数据集大小
- 下载大小: 847019字节。
- 数据集总大小: 1471187字节。
配置
- default: 包含训练数据,路径为
data/train-*。



