suanan/BP_CBG_POC
收藏Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/suanan/BP_CBG_POC
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个中文数据集,包含四个主要字段:_id(唯一标识符)、url(链接)、title(标题)和text(文本内容)。数据集仅包含训练集,数据文件存储在data/train-*路径下。
This dataset is a Chinese dataset containing four main fields: _id (unique identifier), url (link), title (title), and text (text content). The dataset only includes a training set, with data files stored under the path data/train-*.
提供机构:
suanan
原始信息汇总
数据集概述
许可证
- 许可证类型:CC BY-NC 4.0
语言
- 支持语言:中文
数据集信息
特征
- _id: 数据类型为字符串
- url: 数据类型为字符串
- title: 数据类型为字符串
- text: 数据类型为字符串
数据分割
- train: 训练数据集
配置
- config_name: train
- data_files:
- split: train
- path: data/train-*



