ai-aerospace/ams_data_train_mistral_v0.1_100
收藏Hugging Face2023-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ai-aerospace/ams_data_train_mistral_v0.1_100
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含航空航天机制研讨会的前100个问答对,这些问答对是从5000字的文本块中提取的。问答对的生成使用了TheBloke/Llama-2-7B-Chat-GGUF模型,并且格式类似于Mistral的指令型大语言模型(LLMs)。
该数据集包含航空航天机制研讨会的前100个问答对,这些问答对是从5000字的文本块中提取的。问答对的生成使用了TheBloke/Llama-2-7B-Chat-GGUF模型,并且格式类似于Mistral的指令型大语言模型(LLMs)。
提供机构:
ai-aerospace
原始信息汇总
数据集概述
数据集内容
- 类型: 问答对
- 来源: 航空航天机制研讨会的前100个条目
- 字数: 每个条目约5000字
- 文件格式: JSONL
- 文件链接: ams_data_answers.jsonl
数据生成
- 模型: TheBloke/Llama-2-7B-Chat-GGUF
- 格式: 类似于mistral的instruct LLMs
- 示例格式:
<s>[INST] {prompt} [/INST]
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个基于航空航天机制研讨会(AMS)文档的小型训练集,包含100个条目的问答对,用于微调Mistral-7B-Instruct-v0.1等模型。数据集采用CSV格式和Apache 2.0许可证,旨在为航空航天领域的聊天机器人提供专业训练数据,prompt结构遵循Mistral指令格式。其特点是规模小、主题专一,直接支持指令微调任务。
以上内容由遇见数据集搜集并总结生成



