AhmadMustafa/Urdu-Instruct-News-Headline-Generation
收藏Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AhmadMustafa/Urdu-Instruct-News-Headline-Generation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Urdu Instruct News Headline Generation,主要用于文本生成和摘要任务。数据集包含乌尔都语新闻标题生成任务,用户需要根据提供的新闻内容生成相应的标题。数据集包含两个主要部分:训练集和测试集,分别包含100,674和11,187个样本。数据集的输入和输出均为字符串类型,且包含模板ID和模板语言信息。数据集的提示模板和完成模板均为乌尔都语,并提供了英文翻译。
该数据集名为Urdu Instruct News Headline Generation,主要用于文本生成和摘要任务。数据集包含乌尔都语新闻标题生成任务,用户需要根据提供的新闻内容生成相应的标题。数据集包含两个主要部分:训练集和测试集,分别包含100,674和11,187个样本。数据集的输入和输出均为字符串类型,且包含模板ID和模板语言信息。数据集的提示模板和完成模板均为乌尔都语,并提供了英文翻译。
提供机构:
AhmadMustafa
原始信息汇总
数据集概述
数据集名称
Urdu Instruct News Headline Generation
语言
- 乌尔都语 (ur)
数据规模
- 100K < n < 1M
任务类别
- 文本生成
- 摘要生成
数据集特征
- inputs: 字符串类型
- targets: 字符串类型
- template_id: 64位整数类型
- template_lang: 字符串序列类型
数据集分割
- train: 255002720 字节, 100674 条样本
- test: 28284699 字节, 11187 条样本
数据集大小
- 下载大小: 121546528 字节
- 数据集大小: 283287419 字节
配置
- default 配置
- train: data/train-*
- test: data/test-*
任务描述
从给定的新闻生成新闻标题。
提示模板(乌尔都语)
随机选择以下两种模板之一:
- 为以下新闻文章写一个标题: 段落: {}
- 为给定的句子建议标题: 句子: {}
完成模板(乌尔都语)
当然,这是给定文章的标题: {}



