el2e10/aya-paraphrase-bengali

Name: el2e10/aya-paraphrase-bengali
Creator: el2e10
Published: 2024-01-26 14:12:33
License: 暂无描述

Hugging Face2024-01-26 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/el2e10/aya-paraphrase-bengali

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是从AI4Bharat的IndicXParaphrase数据集中提取的，并使用了其中的马拉雅拉姆语部分来创建。数据集是作为Cohere For AI的Aya Open Science Initiative的一部分创建的。IndicXParaphrase数据集是一个多语言的、n-way并行的用于10种印度语言中的释义检测的数据集。该数据集使用了孟加拉语的模板来转换原始数据集。

提供机构：

el2e10

原始信息汇总

数据集概述

基本信息

语言: 孟加拉语
许可证: cc
大小类别: n<1K
源数据集: 扩展自 ai4bharat/IndicXParaphrase
任务类别: 文本生成
友好名称: Aya Paraphrase Bengali

配置

配置名称: default
数据文件:
- 分割: train
- 路径: data/train-*

数据集信息

特征:
- 名称: inputs
  - 数据类型: string
- 名称: targets
  - 数据类型: string
- 名称: template_lang
  - 数据类型: string
- 名称: template_id
  - 数据类型: int64
分割:
- 名称: train
  - 字节数: 625479
  - 样本数: 1001
下载大小: 224004
数据集大小: 625479

模板

模板 1:
- 提示: ভিন্ন শব্দগুচ্ছ ব্যবহার করে নিচের বাক্যটি লেখ: "{original_sentence}"
- 完成: {paraphrased_sentence}
模板 2:
- 提示: নিচের বাক্যটি ভিন্নভাবে লেখ: "{original_sentence}"
- 完成: {paraphrased_sentence}
模板 3:
- 提示: অর্থের পরিবর্তন না করে নিচের বাক্যটি নতুনভাবে লেখ: "{original_sentence}"
- 完成: {paraphrased_sentence}

5,000+

优质数据集

54 个

任务类型

进入经典数据集