five

AnnantJain/wikilingual_dataset

收藏
Hugging Face2024-11-28 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/AnnantJain/wikilingual_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个语言版本的文本数据,每个样本包含一个声明(statement)和一个表示其真实性的标签(is_true)。数据集按语言分割,涵盖了阿拉伯语(ar)、捷克语(cs)、德语(de)、英语(en)、西班牙语(es)、法语(fr)、印地语(hi)、印尼语(id)、意大利语(it)、日语(ja)、韩语(ko)、荷兰语(nl)、葡萄牙语(pt)、俄语(ru)、泰语(th)、土耳其语(tr)、越南语(vi)和中文(zh)等多个语言。每个语言版本的数据集都有相应的文件大小和样本数量。

This dataset contains text data in multiple languages, with each sample consisting of a statement and a label indicating its truthfulness (is_true). The dataset is split by language, covering Arabic (ar), Czech (cs), German (de), English (en), Spanish (es), French (fr), Hindi (hi), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Dutch (nl), Portuguese (pt), Russian (ru), Thai (th), Turkish (tr), Vietnamese (vi), and Chinese (zh), among others. Each language version of the dataset has corresponding file sizes and sample counts.
提供机构:
AnnantJain
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作