malhajar/winogrande-tr
收藏Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/malhajar/winogrande-tr
下载链接
链接失效反馈官方服务:
资源简介:
WinoGrande是一个包含44k个问题的新数据集,灵感来源于Winograd Schema Challenge,但进行了调整以提高规模和对抗数据集特定偏见的鲁棒性。该数据集被设计为一个填空任务,带有二元选项,目标是为给定的句子选择正确的选项,这需要常识推理。数据集旨在通过建立严格的土耳其语基准来评估土耳其语言模型的表现,并特别用于OpenLLMTurkishLeaderboard。数据集的语言为土耳其语。
WinoGrande是一个包含44k个问题的新数据集,灵感来源于Winograd Schema Challenge,但进行了调整以提高规模和对抗数据集特定偏见的鲁棒性。该数据集被设计为一个填空任务,带有二元选项,目标是为给定的句子选择正确的选项,这需要常识推理。数据集旨在通过建立严格的土耳其语基准来评估土耳其语言模型的表现,并特别用于OpenLLMTurkishLeaderboard。数据集的语言为土耳其语。
提供机构:
malhajar
原始信息汇总
数据集概述
数据集名称
- WinoGrande
数据集配置
winogrande_xswinogrande_swinogrande_mwinogrande_lwinogrande_xlwinogrande_debiased
数据字段
sentence: 字符串类型option1: 字符串类型option2: 字符串类型answer: 字符串类型
数据分割
traintestvalidation
数据集大小
winogrande_xs- 下载大小: 3395492 字节
- 数据集大小: 412552 字节
winogrande_s- 下载大小: 3395492 字节
- 数据集大小: 474156 字节
winogrande_m- 下载大小: 3395492 字节
- 数据集大小: 720849 字节
winogrande_l- 下载大小: 3395492 字节
- 数据集大小: 1711424 字节
winogrande_xl- 下载大小: 3395492 字节
- 数据集大小: 5577680 字节
winogrande_debiased- 下载大小: 3395492 字节
- 数据集大小: 1595268 字节
数据实例数量
| 配置名称 | 训练集 | 验证集 | 测试集 |
|---|---|---|---|
| winogrande_xs | 160 | 1267 | 1767 |
| winogrande_s | 640 | 1267 | 1767 |
| winogrande_m | 2558 | 1267 | 1767 |
| winogrande_l | 10234 | 1267 | 1767 |
| winogrande_xl | 40398 | 1267 | 1767 |
| winogrande_debiased | 9248 | 1267 | 1767 |
引用信息
@InProceedings{ai2:winogrande, title = {WinoGrande: An Adversarial Winograd Schema Challenge at Scale}, authors={Keisuke, Sakaguchi and Ronan, Le Bras and Chandra, Bhagavatula and Yejin, Choi}, year={2019} }



