TahmidH/annotated_news_summary
收藏Hugging Face2024-02-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TahmidH/annotated_news_summary
下载链接
链接失效反馈官方服务:
资源简介:
该数据集专为指令调优设计,基于孟加拉语新闻摘要数据集。数据集包含15个模板ID,用于指导输入和输出的配对。数据集的任务类别是摘要生成,数据量级在1万到10万条记录之间。数据集的输入指令和对应的答案分别存储在`inputs`和`targets`列中,通过`template_id`来追踪每个输入-输出模板对。
该数据集专为指令调优设计,基于孟加拉语新闻摘要数据集。数据集包含15个模板ID,用于指导输入和输出的配对。数据集的任务类别是摘要生成,数据量级在1万到10万条记录之间。数据集的输入指令和对应的答案分别存储在`inputs`和`targets`列中,通过`template_id`来追踪每个输入-输出模板对。
提供机构:
TahmidH
原始信息汇总
数据集概述
基本信息
- 许可: cc0-1.0
- 任务类别: 摘要生成
- 语言: 孟加拉语
- 数据规模: 10K<n<100K
数据集描述
- 创建目的: 用于指令调整
- 基础数据集: News Summarization
数据结构
- 输入列:
inputs - 输出列:
targets - 模板ID:
template_id,用于跟踪每个输入模板-目标模板对,共有15个ID(1到15)
模板详情
| ID | inputs_template | targets_template |
|---|---|---|
| 1 | এই সংবাদের জন্য একটি সংবাদ শিরোনাম লেখ: | প্রদত্ত সংবাদের সংবাদ শিরোনাম হলো, |
| 2 | একটি বাক্যে লেখাটির মূল বক্তব্য তুলে ধর: | প্রদত্ত অনুচ্ছেদের সংক্ষিপ্ত মূলভাব হলো, |
| 3 | নিচের অনুচ্ছেদে কী বলা হয়েছে তা সংক্ষেপে বর্ণনা কর। | প্রদত্ত অনুচ্ছেদের সংক্ষিপ্ত মূলভাব হলো, |
| 4 | নিচের অনুচ্ছেদে কী বলা হয়েছে তা সংক্ষেপে বর্ণনা কর। | no_template |
| 5 | এক বাক্যে নিচের অনুচ্ছেদের সারাংশ লেখ। | প্রদত্ত অনুচ্ছেদের সংক্ষিপ্ত মূলভাব হলো, |
| 6 | সংক্ষেপে বাক্যটির মূলভাব তুলে ধরো: | no_template |
| 7 | সংবাদ শিরোনাম লিখুন: | সংবাদটির শিরোনাম হলো, |
| 8 | সংক্ষেপে বাক্যটির মূলভাব তুলে ধরো: | বাক্যটির সংক্ষিপ্ত মূলভাব হলো, |
| 9 | নিন্মলিখিত সংবাদের শিরোনাম কী হতে পারে? | প্রদত্ত সংবাদের সংবাদ শিরোনাম হলো, |
| 10 | এক বাক্যে নিচের অনুচ্ছেদের সারাংশ লেখ। | no_template |
| 11 | আরো কম শব্দে বাক্যটির মূলভাব বর্ণনা কর: | no_template |
| 12 | প্রদত্ত তথ্য ব্যবহার করে একটি সংবাদ শিরোনাম লিখুন: | সংবাদটির শিরোনাম হলো, |
| 13 | আরো কম শব্দে বাক্যটির মূলভাব বর্ণনা কর: | বাক্যটির সংক্ষিপ্ত মূলভাব হলো, |
| 14 | একটি বাক্যে লেখাটির মূল বক্তব্য তুলে ধর: | no_template |
| 15 | নিম্নলিখিত সংবাদের ভিত্তিতে একটি সংবাদ শিরোনাম লিখুন | প্রদত্ত সংবাদের সংবাদ শিরোনাম হলো, |



