five

pourmand1376/persian-qa-translated

收藏
Hugging Face2023-08-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pourmand1376/persian-qa-translated
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Persian QA Translated,主要用于问答、翻译和文本生成任务,支持波斯语和英语。数据集包含一个训练分割,有153127个示例。特征包括输入、指令、原始指令、原始输出、输出和来源。数据集的许可证是Apache-2.0,数据集大小在100K到1M之间。

This dataset includes multiple features such as input, instruction, original instruction, original output, output, and source, with data types of float64 and string. The dataset is divided into a training set containing 153127 samples. The tasks categories involved include question-answering, translation, and text-generation, supporting languages of Persian and English. The dataset is named Persian QA Translated, licensed under Apache 2.0.
提供机构:
pourmand1376
原始信息汇总

数据集概述

数据集信息

特征

  • input: 数据类型为 float64
  • instruction: 数据类型为 string
  • original_instruction: 数据类型为 string
  • original_output: 数据类型为 string
  • output: 数据类型为 string
  • source: 数据类型为 string

分割

  • train: 包含 153127 个样本,总字节数为 360540755

大小

  • 下载大小: 186783724 字节
  • 数据集大小: 360540755 字节

配置

  • default: 包含训练数据文件,路径为 data/train-*

许可证

  • apache-2.0

任务类别

  • question-answering
  • translation
  • text-generation

语言

  • fa (波斯语)
  • en (英语)

名称

  • Persian QA Translated

大小类别

  • 100K<n<1M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作