thienhtt20/balanced_dataset
收藏数据集概述
基本信息
- 名称: balanced_dataset
- 描述: thienhtt20/balanced_dataset 数据集托管在 HF Mirror 上,由 HF Datasets 社区贡献。
- 别名: thienhtt20/balanced_dataset
- 创建者: Huynh Tan Thien
- URL: https://hf-mirror.com/datasets/thienhtt20/balanced_dataset
关键词
- 100K - 1M
- parquet
- Tabular
- Text
- Datasets
- pandas
- Croissant
- 🇺🇸 Region: US
数据集结构
-
分布:
-
类型: cr:FileObject
-
名称: repo
-
描述: HF Mirror git 仓库。
-
内容 URL: https://hf-mirror.com/datasets/thienhtt20/balanced_dataset/tree/refs%2Fconvert%2Fparquet
-
编码格式: git+https
-
类型: cr:FileSet
-
名称: parquet-files-for-config-default
-
描述: 由 HF Mirror 转换的底层 Parquet 文件(参见:https://hf-mirror.com/docs/datasets-server/parquet)。
-
包含于: repo
-
编码格式: application/x-parquet
-
包含: default//.parquet
-
-
记录集:
-
类型: cr:RecordSet
-
名称: default
-
描述: thienhtt20/balanced_dataset - default 子集
- 2 个分割: train, test
- 2 个跳过的列: input_ids, attention_mask
-
字段:
-
类型: cr:Field
-
名称: default/id
-
描述: HF Mirror parquet 文件中的 id 列。
-
数据类型: sc:Integer
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: id
-
类型: cr:Field
-
名称: default/label
-
描述: HF Mirror parquet 文件中的 label 列。
-
数据类型: sc:Integer
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: label
-
类型: cr:Field
-
名称: default/claim
-
描述: HF Mirror parquet 文件中的 claim 列。
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: claim
-
类型: cr:Field
-
名称: default/document
-
描述: HF Mirror parquet 文件中的 document 列。
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: document
-
类型: cr:Field
-
名称: default/index_level_0
-
描述: HF Mirror parquet 文件中的 index_level_0 列。
-
数据类型: sc:Integer
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: index_level_0
-
-



