five

aixsatoshi/Longcontext-aozora-instruction

收藏
Hugging Face2024-03-30 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/aixsatoshi/Longcontext-aozora-instruction
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于长文指令生成的数据集,特别是针对长文的问答风格。数据集来源于青空文库数据集,并且没有对问答的正确性进行过滤,以保留困难的任务指令。使用该数据集进行微调时,模型性能的影响较大。

该数据集是一个用于长文指令生成的数据集,特别是针对长文的问答风格。数据集来源于青空文库数据集,并且没有对问答的正确性进行过滤,以保留困难的任务指令。使用该数据集进行微调时,模型性能的影响较大。
提供机构:
aixsatoshi
原始信息汇总

数据集概述

数据集名称

  • 长文用instruction数据集

语言

  • 日语(ja)

数据来源

主要目的

  • 提供长文的质问应答风格
  • 未进行质问应答的正误过滤,以保留困难任务的instruction

使用限制

  • 长文通常会导致性能下降,因此是一个困难的任务
  • 在微调时,微调效果会根据基础模型的性能而有较大变化
  • 能否正确回答取决于模型参数和预训练

许可证

  • CC BY 4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作