YnezT/Filtered-BookMIA
收藏Hugging Face2024-05-14 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/YnezT/Filtered-BookMIA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含书籍ID、书籍名称、片段ID、片段内容和标签等字段。数据集主要分为训练集,训练集大小为26895229字节,包含9000个样本。下载数据集的大小为17112010字节。数据集配置包括默认配置,训练数据文件路径为data/train-*。
提供机构:
YnezT
原始信息汇总
数据集概述
数据集特征
- book_id: 数据类型为 int64
- book: 数据类型为 string
- snippet_id: 数据类型为 int64
- snippet: 数据类型为 string
- label: 数据类型为 int64
数据集划分
- train:
- 数据量: 26,895,229 字节
- 示例数量: 9,000
数据集大小
- 下载大小: 17,112,010 字节
- 数据集大小: 26,895,229 字节
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*



