Ba2han/Llama-Instruct-Mix-3k
收藏Hugging Face2024-05-09 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Ba2han/Llama-Instruct-Mix-3k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于hamnaanaa/MixInstruct-Llama-3,并进行了多项清理和质量控制操作。清理操作包括删除拒绝消息、过短的答案以及所有Llama-2-7B的示例。使用量化的Llama-3-70B Instruct对示例进行了评分,并删除了评分低于8的示例。最后,合并了指令和输入列。
该数据集来源于hamnaanaa/MixInstruct-Llama-3,并进行了多项清理和质量控制操作。清理操作包括删除拒绝消息、过短的答案以及所有Llama-2-7B的示例。使用量化的Llama-3-70B Instruct对示例进行了评分,并删除了评分低于8的示例。最后,合并了指令和输入列。
提供机构:
Ba2han
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 文本生成
- 语言: 英语
- 数据集大小: 1K<n<10K
数据集处理
- 原始数据集: hamnaanaa/MixInstruct-Llama-3
- 数据清洗:
- 清理了大部分拒绝消息。
- 移除了过短的回答。
- 移除了所有llama-2-7B的示例。
- 使用量化后的Llama-3-70B Instruct对示例进行评分。
- 移除了评分低于8的示例。
- 合并了instruct和input列。



