AhmadMustafa/Urdu-Instruct-News-Article-Generation
收藏Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AhmadMustafa/Urdu-Instruct-News-Article-Generation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Urdu-Instruct-News-Article-Generation,主要用于从给定标题生成新闻文章的任务。数据集包含训练集和测试集,分别有100674和11187个样本。数据集的特征包括输入、目标、模板ID和模板语言。此外,README还提供了用于生成新闻文章的提示模板和完成模板的乌尔都语版本及其英文翻译。
该数据集名为Urdu-Instruct-News-Article-Generation,主要用于从给定标题生成新闻文章的任务。数据集包含训练集和测试集,分别有100674和11187个样本。数据集的特征包括输入、目标、模板ID和模板语言。此外,README还提供了用于生成新闻文章的提示模板和完成模板的乌尔都语版本及其英文翻译。
提供机构:
AhmadMustafa
原始信息汇总
数据集卡片 "Urdu-Instruct-News-Article-Generation"
任务
从给定的标题生成新闻文章。
数据集信息
- 语言: 乌尔都语
- 大小类别: 100K<n<1M
- 任务类别: 文本生成, 文本到文本生成
- 美观名称: Instruct News Article Generation Urdu
特征
- inputs: 字符串
- targets: 字符串
- template_id: 整数64位
- template_lang: 字符串序列
分割
- 训练集:
- 字节数: 257489376
- 样本数: 100674
- 测试集:
- 字节数: 28303926
- 样本数: 11187
下载和数据集大小
- 下载大小: 121675545
- 数据集大小: 285793302
配置
- 默认配置:
- 训练集文件路径: data/train-*
- 测试集文件路径: data/test-*
提示模板(乌尔都语)
随机选择以下两种模板之一:
- 模板ID 1: "اس دی گی ایک خبر سے متعلق ایک مضمون لکھیں۔ خبر: {}"
- 模板ID 2: "یہ خبر جو {} سے تعلق رکھتی ہے، اس پر ایک مضمون لکھیں۔ خبر: {}"
翻译
- 写一篇关于给定新闻的文章。新闻: {}
- 给定属于类别{}的新闻,写一篇关于它的文章。新闻: {}
完成模板(乌尔都语)
"جی ضرور، یہ رہا آپ کی خبر سے متعلق ایک مضمون: {}"
翻译
"当然,这是关于给定新闻的文章: {}"



