five

Samoed/IndicCrosslingualSTS

收藏
Hugging Face2024-12-04 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/Samoed/IndicCrosslingualSTS
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多种语言对的句子对及其对应的分数。每个语言对的配置包括两个句子(sentence1和sentence2)和一个分数(score),并且每个配置只有一个测试分割(test)。数据集涵盖了英语与阿萨姆语、孟加拉语、古吉拉特语、印地语、卡纳达语、马拉雅拉姆语、马拉地语、奥里亚语、旁遮普语、泰米尔语、泰卢固语和乌尔都语之间的句子对。

This dataset contains sentence pairs in multiple language pairs (e.g., English-Assamese, English-Bengali, etc.), each consisting of two sentences (sentence1 and sentence2) and a score. The dataset only includes a test split with 256 samples each. The size and download size of the dataset are detailed for each language pair configuration.
提供机构:
Samoed
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作