aixsatoshi/Longcontext-aozora-instruction
收藏Hugging Face2024-03-30 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/aixsatoshi/Longcontext-aozora-instruction
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于长文指令生成的数据集,特别是针对长文的问答风格。数据集来源于青空文库数据集,并且没有对问答的正确性进行过滤,以保留困难的任务指令。使用该数据集进行微调时,模型性能的影响较大。
该数据集是一个用于长文指令生成的数据集,特别是针对长文的问答风格。数据集来源于青空文库数据集,并且没有对问答的正确性进行过滤,以保留困难的任务指令。使用该数据集进行微调时,模型性能的影响较大。
提供机构:
aixsatoshi
原始信息汇总
数据集概述
数据集名称
- 长文用instruction数据集
语言
- 日语(ja)
数据来源
- 青空文库数据集,具体链接为:globis-university/aozorabunko-clean
主要目的
- 提供长文的质问应答风格
- 未进行质问应答的正误过滤,以保留困难任务的instruction
使用限制
- 长文通常会导致性能下降,因此是一个困难的任务
- 在微调时,微调效果会根据基础模型的性能而有较大变化
- 能否正确回答取决于模型参数和预训练
许可证
- CC BY 4.0



