ai4bharat/hellaswag-hi
收藏Hugging Face2024-05-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ai4bharat/hellaswag-hi
下载链接
链接失效反馈官方服务:
资源简介:
Hellaswag数据集是一个用于评估常识推理能力的上下文和活动描述集合。这个特定数据集是原始Hellaswag数据集的印地语翻译版本,为研究印地语领域的常识推理提供了资源。测试集包含9,983个示例,用于评估模型性能;验证集包含10,016个示例,用于模型验证和调优。数据集总大小为107.19 MB,下载大小约为41.7 MB。
Hellaswag数据集是一个用于评估常识推理能力的上下文和活动描述集合。这个特定数据集是原始Hellaswag数据集的印地语翻译版本,为研究印地语领域的常识推理提供了资源。测试集包含9,983个示例,用于评估模型性能;验证集包含10,016个示例,用于模型验证和调优。数据集总大小为107.19 MB,下载大小约为41.7 MB。
提供机构:
ai4bharat
原始信息汇总
Hellaswag-Translated 数据集概述
数据集描述
Hellaswag-Translated 数据集是 Hellaswag 数据集的 Hindi 语言翻译版本,旨在评估常识推理能力。
数据特征
- ind: 类型为
int32 - activity_label: 类型为
string - ctx_a: 类型为
string - ctx_b: 类型为
string - source_id: 类型为
string - split: 类型为
string - split_type: 类型为
string - label: 类型为
string - itv2 hi 0: 类型为
string - itv2 hi 1: 类型为
string - itv2 hi 2: 类型为
string - itv2 hi 3: 类型为
string - ctx: 类型为
string - endings: 类型为
sequence的string
数据分割
- Test Set: 包含 9,983 个样本,用于模型性能评估。
- Validation Set: 包含 10,016 个样本,用于模型验证和调优。
数据集大小
- 总数据集大小: 107.19 MB
- 下载大小: 41.7 MB
配置
- default 配置包含以下数据文件:
- test: 路径为
data/test-* - validation: 路径为
data/validation-*
- test: 路径为



