five

Ba2han/Llama-Instruct-Mix-3k

收藏
Hugging Face2024-05-09 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Ba2han/Llama-Instruct-Mix-3k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来源于hamnaanaa/MixInstruct-Llama-3,并进行了多项清理和质量控制操作。清理操作包括删除拒绝消息、过短的答案以及所有Llama-2-7B的示例。使用量化的Llama-3-70B Instruct对示例进行了评分,并删除了评分低于8的示例。最后,合并了指令和输入列。

该数据集来源于hamnaanaa/MixInstruct-Llama-3,并进行了多项清理和质量控制操作。清理操作包括删除拒绝消息、过短的答案以及所有Llama-2-7B的示例。使用量化的Llama-3-70B Instruct对示例进行了评分,并删除了评分低于8的示例。最后,合并了指令和输入列。
提供机构:
Ba2han
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本生成
  • 语言: 英语
  • 数据集大小: 1K<n<10K

数据集处理

  • 原始数据集: hamnaanaa/MixInstruct-Llama-3
  • 数据清洗:
    • 清理了大部分拒绝消息。
    • 移除了过短的回答。
    • 移除了所有llama-2-7B的示例。
    • 使用量化后的Llama-3-70B Instruct对示例进行评分。
    • 移除了评分低于8的示例。
    • 合并了instruct和input列。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作