wesslen/ecfr-title-12
收藏Hugging Face2024-05-29 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/wesslen/ecfr-title-12
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要包含文本数据及其相关的元数据信息。文本数据存储在text字段中,而元数据则存储在meta字段中,元数据包括章节、章节标题、子章节、子章节标题、部分、部分标题、节和节标题等信息。数据集仅包含一个训练集,共有4665个样本,总大小为16669304字节。
该数据集主要包含文本数据及其相关的元数据信息。文本数据存储在text字段中,而元数据则存储在meta字段中,元数据包括章节、章节标题、子章节、子章节标题、部分、部分标题、节和节标题等信息。数据集仅包含一个训练集,共有4665个样本,总大小为16669304字节。
提供机构:
wesslen
原始信息汇总
数据集概述
语言
- 英文(en)
数据集信息
特征
- text: 数据类型为字符串(string)
- meta: 结构化数据,包含以下字段:
- chapter: 序列类型为字符串(string)
- chapter_title: 序列类型为字符串(string)
- subchapter: 序列类型为字符串(string)
- subchapter_title: 序列类型为字符串(string)
- part: 序列类型为字符串(string)
- part_title: 序列类型为字符串(string)
- section: 序列类型为字符串(string)
- section_title: 序列类型为字符串(string)
分割
- train: 包含4665个样本,占用16669304字节
大小
- 下载大小: 5913311字节
- 数据集大小: 16669304字节
配置
- default: 数据文件路径为
data/train-*



