mbzuai-ugrip-statement-tuning/xnli
收藏Hugging Face2024-06-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mbzuai-ugrip-statement-tuning/xnli
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种语言的文本对,每个文本对由三个语句(statement1, statement2, statement3)和一个标签组成,标签有三个类别:entailment(蕴含)、neutral(中立)和contradiction(矛盾)。数据集涵盖了阿拉伯语、保加利亚语、德语、希腊语、英语、西班牙语、法语、印地语、俄语、斯瓦希里语、泰语、土耳其语、乌尔都语、越南语和中文。每个语言配置的数据集包含5010个测试样本。
该数据集包含多种语言的文本对,每个文本对由三个语句(statement1, statement2, statement3)和一个标签组成,标签有三个类别:entailment(蕴含)、neutral(中立)和contradiction(矛盾)。数据集涵盖了阿拉伯语、保加利亚语、德语、希腊语、英语、西班牙语、法语、印地语、俄语、斯瓦希里语、泰语、土耳其语、乌尔都语、越南语和中文。每个语言配置的数据集包含5010个测试样本。
提供机构:
mbzuai-ugrip-statement-tuning
原始信息汇总
数据集概述
数据集配置信息
| 配置名称 | 特征 |
|---|---|
| ar | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| bg | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| de | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| el | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| en | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| es | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| fr | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| hi | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| ru | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| sw | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| th | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| tr | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| ur | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| vi | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
| zh | - label: 类别标签(entailment, neutral, contradiction)<br>- statement1: 字符串<br>- statement2: 字符串<br>- statement3: 字符串 |
数据集大小信息
| 配置名称 | 测试集大小 | 下载大小 |
|---|---|---|
| ar | 4134237字节 | 1333042字节 |
| bg | 4970183字节 | 1509413字节 |
| de | 3238417字节 | 1183434字节 |
| el | 5364511字节 | 1648397字节 |
| en | 2874400字节 | 1015046字节 |
| es | 3157446字节 | 1137504字节 |
| fr | 3336106字节 | 1198939字节 |
| hi | 6469731字节 | 1702262字节 |
| ru | 5060554字节 | 1621731字节 |
| sw | 2864638字节 | 1053029字节 |
| th | 6692024字节 | 1737262字节 |
| tr | 3055540字节 | 1121287字节 |
| ur | 4501709字节 | 1459263字节 |
| vi | 3823931字节 | 1222934字节 |
| zh | 2581188字节 | 1014564字节 |
数据集文件路径
| 配置名称 | 测试集路径 |
|---|---|
| ar | ar/test-* |
| bg | bg/test-* |
| de | de/test-* |
| el | el/test-* |
| en | en/test-* |
| es | es/test-* |
| fr | fr/test-* |
| hi | hi/test-* |
| ru | ru/test-* |
| sw | sw/test-* |
| th | th/test-* |
| tr | tr/test-* |
| ur | ur/test-* |
| vi | vi/test-* |
| zh | zh/test-* |



