malhajar/hellaswag-tr
收藏Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/malhajar/hellaswag-tr
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Hellaswag的土耳其语翻译版本,专门用于OpenLLMTurkishLeaderboard。它包含从ACL2019发表的论文《Can a Machine Really Finish Your Sentence?》中提取的严格测试,主要用于测试模型的完成能力。该数据集旨在通过建立严格的土耳其语基准来评估土耳其语言模型的性能。
该数据集是Hellaswag的土耳其语翻译版本,专门用于OpenLLMTurkishLeaderboard。它包含从ACL2019发表的论文《Can a Machine Really Finish Your Sentence?》中提取的严格测试,主要用于测试模型的完成能力。该数据集旨在通过建立严格的土耳其语基准来评估土耳其语言模型的性能。
提供机构:
malhajar
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别: 问答
- 语言: 土耳其语
- 数据集大小: 10K<n<100K
数据集划分
- 训练集:
- 字节数: 43232624
- 样本数: 39905
- 测试集:
- 字节数: 10791853
- 样本数: 10003
- 验证集:
- 字节数: 11175717
- 样本数: 10042
数据集特征
- ind: 类型 int32
- activity_label: 类型 string
- ctx_a: 类型 string
- ctx_b: 类型 string
- ctx: 类型 string
- endings: 序列类型 string
- source_id: 类型 string
- split: 类型 string
- split_type: 类型 string
- label: 类型 string
数据集描述
- 语言: 土耳其语
- 翻译来源: hellaswag



