five

m0javad/Degarbayan-SC-dataset

收藏
Hugging Face2024-02-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/m0javad/Degarbayan-SC-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Degarbayan-SC是一个波斯语(Farsi)的俚语释义数据集,基于预训练的mT5模型。该数据集包含大量不同形式的释义句子,如句法、语义和概念上的释义。句子长度分布在3到19个单词之间,平均为8个单词,共有128,699个独特单词。

Degarbayan-SC是一个波斯语(Farsi)的俚语释义数据集,基于预训练的mT5模型。该数据集包含大量不同形式的释义句子,如句法、语义和概念上的释义。句子长度分布在3到19个单词之间,平均为8个单词,共有128,699个独特单词。
提供机构:
m0javad
原始信息汇总

Degarbayan-SC 数据集概述

任务类别

  • 文本生成
  • 对话生成
  • 文本到文本生成

语言

  • 波斯语

数据集大小

  • 100M<n<1B

数据集描述

Degarbayan-SC 数据集是一个使用预训练 mT5 模型的波斯语口语 paraphrase 数据集。该数据集源自 Degarbayan-SC 论文

统计信息

  • 句子长度分布在 3 到 19 个单词之间,平均句子长度为 8 个单词。
  • 数据集中包含 128,699 个独特的单词。
  • 数据集包含大量不同形式的 paraphrase 句子,包括句法、语义和概念 paraphrase。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作