AnnantJain/wikilingual_dataset
收藏Hugging Face2024-11-28 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/AnnantJain/wikilingual_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个语言版本的文本数据,每个样本包含一个声明(statement)和一个表示其真实性的标签(is_true)。数据集按语言分割,涵盖了阿拉伯语(ar)、捷克语(cs)、德语(de)、英语(en)、西班牙语(es)、法语(fr)、印地语(hi)、印尼语(id)、意大利语(it)、日语(ja)、韩语(ko)、荷兰语(nl)、葡萄牙语(pt)、俄语(ru)、泰语(th)、土耳其语(tr)、越南语(vi)和中文(zh)等多个语言。每个语言版本的数据集都有相应的文件大小和样本数量。
This dataset contains text data in multiple languages, with each sample consisting of a statement and a label indicating its truthfulness (is_true). The dataset is split by language, covering Arabic (ar), Czech (cs), German (de), English (en), Spanish (es), French (fr), Hindi (hi), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Dutch (nl), Portuguese (pt), Russian (ru), Thai (th), Turkish (tr), Vietnamese (vi), and Chinese (zh), among others. Each language version of the dataset has corresponding file sizes and sample counts.
提供机构:
AnnantJain



