five

ai-aerospace/ams_data_train_mistral_v0.1_100

收藏
Hugging Face2023-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ai-aerospace/ams_data_train_mistral_v0.1_100
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含航空航天机制研讨会的前100个问答对,这些问答对是从5000字的文本块中提取的。问答对的生成使用了TheBloke/Llama-2-7B-Chat-GGUF模型,并且格式类似于Mistral的指令型大语言模型(LLMs)。

该数据集包含航空航天机制研讨会的前100个问答对,这些问答对是从5000字的文本块中提取的。问答对的生成使用了TheBloke/Llama-2-7B-Chat-GGUF模型,并且格式类似于Mistral的指令型大语言模型(LLMs)。
提供机构:
ai-aerospace
原始信息汇总

数据集概述

数据集内容

  • 类型: 问答对
  • 来源: 航空航天机制研讨会的前100个条目
  • 字数: 每个条目约5000字
  • 文件格式: JSONL
  • 文件链接: ams_data_answers.jsonl

数据生成

  • 模型: TheBloke/Llama-2-7B-Chat-GGUF
  • 格式: 类似于mistral的instruct LLMs
  • 示例格式: <s>[INST] {prompt} [/INST]
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个基于航空航天机制研讨会(AMS)文档的小型训练集,包含100个条目的问答对,用于微调Mistral-7B-Instruct-v0.1等模型。数据集采用CSV格式和Apache 2.0许可证,旨在为航空航天领域的聊天机器人提供专业训练数据,prompt结构遵循Mistral指令格式。其特点是规模小、主题专一,直接支持指令微调任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作