mbzuai-ugrip-statement-tuning/exams
收藏Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mbzuai-ugrip-statement-tuning/exams
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种语言的配置,每个配置包含两个特征:is_true(表示陈述的真实性,数据类型为int64)和statement(表示陈述内容,数据类型为string)。数据集被分为训练集和验证集,并提供了每个分割的字节数和示例数。数据集涵盖了保加利亚语(bg)、克罗地亚语(hr)、匈牙利语(hu)、意大利语(it)、马其顿语(mk)、波兰语(pl)、葡萄牙语(pt)、阿尔巴尼亚语(sq)、塞尔维亚语(sr)、土耳其语(tr)和越南语(vi)等多种语言。
该数据集包含多种语言的配置,每个配置包含两个特征:is_true(表示陈述的真实性,数据类型为int64)和statement(表示陈述内容,数据类型为string)。数据集被分为训练集和验证集,并提供了每个分割的字节数和示例数。数据集涵盖了保加利亚语(bg)、克罗地亚语(hr)、匈牙利语(hu)、意大利语(it)、马其顿语(mk)、波兰语(pl)、葡萄牙语(pt)、阿尔巴尼亚语(sq)、塞尔维亚语(sr)、土耳其语(tr)和越南语(vi)等多种语言。
提供机构:
mbzuai-ugrip-statement-tuning
原始信息汇总
数据集概述
数据集配置
| 配置名称 | 特征 |
|---|---|
| bg | - is_true: int64<br>- statement: string |
| hr | - is_true: int64<br>- statement: string |
| hu | - is_true: int64<br>- statement: string |
| it | - is_true: int64<br>- statement: string |
| mk | - is_true: int64<br>- statement: string |
| pl | - is_true: int64<br>- statement: string |
| pt | - is_true: int64<br>- statement: string |
| sq | - is_true: int64<br>- statement: string |
| sr | - is_true: int64<br>- statement: string |
| tr | - is_true: int64<br>- statement: string |
| vi | - is_true: int64<br>- statement: string |
数据集大小
| 配置名称 | 下载大小 | 数据集大小 |
|---|---|---|
| bg | 319684 | 680197 |
| hr | 286597 | 462323 |
| hu | 216370 | 376499 |
| it | 143813 | 241314 |
| mk | 242853 | 501212 |
| pl | 208867 | 334179 |
| pt | 118908 | 205816 |
| sq | 147873 | 242765 |
| sr | 212606 | 417082 |
| tr | 273326 | 464938 |
| vi | 323300 | 693832 |
数据集分割
| 配置名称 | 训练集 | 验证集 |
|---|---|---|
| bg | num_bytes: 537818<br>num_examples: 2344 | num_bytes: 142379<br>num_examples: 593 |
| hr | num_bytes: 378436<br>num_examples: 2341 | num_bytes: 83887<br>num_examples: 538 |
| hu | num_bytes: 292627<br>num_examples: 1731 | num_bytes: 83872<br>num_examples: 536 |
| it | num_bytes: 194688<br>num_examples: 1010 | num_bytes: 46626<br>num_examples: 246 |
| mk | num_bytes: 400405<br>num_examples: 1665 | num_bytes: 100807<br>num_examples: 410 |
| pl | num_bytes: 269588<br>num_examples: 1577 | num_bytes: 64591<br>num_examples: 394 |
| pt | num_bytes: 166832<br>num_examples: 740 | num_bytes: 38984<br>num_examples: 184 |
| sq | num_bytes: 192218<br>num_examples: 1194 | num_bytes: 50547<br>num_examples: 311 |
| sr | num_bytes: 339750<br>num_examples: 1323 | num_bytes: 77332<br>num_examples: 314 |
| tr | num_bytes: 370060<br>num_examples: 1571 | num_bytes: 94878<br>num_examples: 393 |
| vi | num_bytes: 557991<br>num_examples: 1955 | num_bytes: 135841<br>num_examples: 488 |



