37channel/news-dataset-20240506-g-rss-step-1
收藏Hugging Face2024-06-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/37channel/news-dataset-20240506-g-rss-step-1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如标题、内容、日期、URL等,主要用于存储与特定主题相关的信息。数据集的训练集包含425个样本,总大小为1473561字节。数据集的下载大小为852461字节。
This dataset includes multiple feature fields such as title, content, date, URL, etc., primarily used for storing information related to specific topics. The training set of the dataset contains 425 samples with a total size of 1473561 bytes. The download size of the dataset is 852461 bytes.
提供机构:
37channel
原始信息汇总
数据集概述
特征信息
数据集包含以下特征:
after_inf_title2context_1: 字符串类型after_inf_title2context_{i+1}: 字符串类型before_inf_title2context: 字符串类型content: 字符串类型date: 字符串类型interested-llm: 字符串类型step: 字符串类型title: 字符串类型url: 字符串类型index: 整数类型
数据分割
数据集分为以下部分:
train: 包含425个样本,占用1474167字节
数据集大小
- 下载大小: 851135字节
- 数据集大小: 1474167字节
配置信息
- 配置名称:
default - 数据文件路径:
data/train-*



