five

Electrohydrodynamics

收藏
Hugging Face2024-12-14 更新2024-12-15 收录
下载链接:
https://huggingface.co/datasets/Taylor658/Electrohydrodynamics
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含6000个高保真训练实例的综合集合,专门用于微调Mistral-Large-Instruct-2411基础模型。数据集捕捉了电动力学在霍尔效应推进器中的理论、计算和实验方面。其关键特点包括多模态元素(如LaTeX方程、代码片段、文本解释和元数据)、涵盖的领域(理论、计算、实验)、参数范围(如电场和等离子体密度)以及详细的元数据(如示例、注释、预期输出格式、标签和评估标准)。数据集旨在增强大型语言模型在等离子体物理及相关领域的推理、推导和问题解决能力,并支持科学研究,特别是先进推进系统的开发。

This dataset is a comprehensive collection of 6000 high-fidelity training instances, specifically tailored for fine-tuning the Mistral-Large-Instruct-2411 base model. It covers the theoretical, computational and experimental aspects of electrodynamics in Hall-effect thrusters. Its key features include multimodal elements (such as LaTeX equations, code snippets, textual explanations and metadata), covered research domains (theoretical, computational, experimental), parameter ranges (e.g., electric field and plasma density), and detailed metadata including examples, annotations, expected output formats, labels and evaluation criteria. This dataset aims to enhance the reasoning, deduction and problem-solving capabilities of large language models in plasma physics and related fields, and support scientific research, particularly the development of advanced propulsion systems.
创建时间:
2024-12-12
原始信息汇总

Electrohydrodynamics in Hall Effect Thrusters Dataset

数据集概述

该数据集是一个包含6,000个高保真训练实例的综合集合,专门用于微调Mistral-Large-Instruct-2411基础模型。它涵盖了霍尔效应推进器中电动力学的理论、计算和实验方面

关键特性:

  • 多模态元素:包括LaTeX公式、代码片段、文本解释和元数据,适用于多种机器学习任务。
  • 涵盖领域
    • 理论:控制方程、等离子体物理原理和标度定律。
    • 计算:模拟方法(PIC、MHD)、数值技术和伪代码实现。
    • 实验:测量技术、参数估计和诊断方法。
  • 参数范围
    • 电场:0.1 - 10 kV/mm
    • 等离子体密度:(10^{18} - 10^{21} , ext{m}^{-3})
    • 电荷载流子迁移率:全面覆盖。
  • 详细元数据:包括示例、注释、预期输出格式、标签、引用和评估标准。

数据集结构

列:

  • instruction:提供给模型的任务或查询,用于完成或解释。
  • response:对指令的详细预期响应,格式化以支持多模态输出。
  • domain:指定任务的上下文(例如,理论、计算、实验)。
  • complexity:任务的难度级别(例如,初学者、中级、高级)。
  • parameters:指定关键变量的JSON编码字典,如电场范围和等离子体密度。
  • examples:示例输入和输出,说明指令-响应对的上下文。
  • notes:提供有关任务的额外信息的上下文注释或评论。
  • expected_output_format:指定所需的输出格式(例如,LaTeX、代码、文本)。
  • tags:数据集条目的分类标签(例如,“等离子体物理”,“霍尔推进器”)。

示例行:

instruction response domain complexity parameters examples notes expected_output_format tags
"Instruction 1: Discuss how to set up a 2D PIC simulation for electron density distribution." "In this theoretical context, we consider the underlying physics governing electron motion in the magnetic field.
A key equation often used is the electron cyclotron frequency:

[ \omega_{ce} = \frac{qB}{m_e} ]

Typical parameter ranges might include electric fields of 0.1 to 1 kV/mm and plasma densities of 1e18 to 1e19 m^-3. By examining how these parameters influence cross-field electron mobility, we can better understand and optimize Hall thruster performance." | theoretical | beginner | {"electric_field_range": "0.1 to 1 kV/mm", "plasma_density_range": "1e18 to 1e19 m^-3"} | "Example: Provide a detailed derivation of the governing equations for plasma dynamics." | "This instruction pertains to the theoretical domain, focusing on advanced applications in Hall thruster research." | "LaTeX equations and textual explanation" | ["theoretical", "beginner", "Hall thruster", "electrohydrodynamics"] |

预期用途

该数据集专门设计用于微调大型语言模型(如Mistral-Large-Instruct-2411),以:

  • 增强其在等离子体物理及相关领域中的推理、推导和问题解决能力。
  • 实现包括文本、数学和计算元素的多模态输出。
  • 支持科学研究中AI模型的开发,特别是在先进推进系统领域。

许可证与引用

许可证Apache License 2.0

bibtex @dataset{electrohydrodynamics_dataset_2024, title={{Electrohydrodynamics in Hall Effect Thrusters Dataset}}, author={A Taylor}, howpublished={url{https://hf.co/taylor658}}, year={2024}, note={Synthetic dataset for fine-tuning foundation models in plasma physics and advanced propulsion systems.} }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过精心设计,汇集了6,000个高保真训练实例,专门用于微调Mistral-Large-Instruct-2411基础模型。其构建涵盖了电动力学在霍尔效应推进器中的理论、计算和实验三个主要领域,确保了数据的全面性和多样性。每个实例均包含多模态元素,如LaTeX公式、代码片段、文本解释及详细的元数据,以支持多样的机器学习任务。此外,数据集还涵盖了从基础到高级的复杂度层次,确保了不同层次学习者的需求。
特点
该数据集的显著特点在于其多模态特性和领域覆盖的广泛性。不仅包含了理论、计算和实验三个领域的详细内容,还通过LaTeX公式、代码片段和文本解释等多种形式,提供了丰富的信息表达方式。此外,数据集还详细记录了关键参数范围,如电场强度和等离子体密度,以及详细的元数据,如示例、注释和预期输出格式,使得数据集在科学研究中具有极高的实用价值。
使用方法
该数据集主要用于微调大型语言模型,如Mistral-Large-Instruct-2411,以提升其在等离子体物理及相关领域的推理、推导和问题解决能力。通过使用该数据集,模型能够生成包含文本、数学和计算元素的多模态输出,从而支持科学研究,特别是在先进推进系统中的应用。用户可以根据数据集中的指令、响应、领域、复杂度等字段,进行定制化的模型训练和评估。
背景与挑战
背景概述
电动力学(Electrohydrodynamics)数据集是由A Taylor于2024年创建的,旨在为Mistral-Large-Instruct-2411基础模型的微调提供高质量的训练实例。该数据集聚焦于霍尔效应推进器中的电动力学理论、计算和实验方面,涵盖了等离子体物理学、数值模拟方法和实验诊断技术等多个领域。通过包含LaTeX公式、代码片段和文本解释等多模态元素,该数据集不仅丰富了机器学习任务的多样性,还为科学研究,特别是先进推进系统的研究,提供了强有力的支持。
当前挑战
该数据集在构建过程中面临多项挑战。首先,整合多模态数据(如LaTeX公式、代码片段等)需要确保各元素之间的逻辑一致性和准确性。其次,数据集涵盖了从理论到实验的广泛领域,要求对不同领域的专业知识有深入的理解和精确的表达。此外,参数范围的广泛性(如电场范围和等离子体密度)增加了数据集的复杂性,需要精确的参数控制和验证。最后,为支持大规模语言模型的微调,数据集的结构化和标准化也是一项重要挑战。
常用场景
经典使用场景
该数据集的经典使用场景主要集中在对Mistral-Large-Instruct-2411大型语言模型的微调上,特别是在电动力学和霍尔效应推进器领域的理论、计算和实验研究中。通过提供包含LaTeX公式、代码片段、文本解释和元数据的多模态元素,该数据集能够帮助模型在处理复杂的物理问题时,生成包含数学推导、数值模拟和实验诊断的详细响应。
衍生相关工作
基于该数据集,已经衍生出了一系列经典工作,特别是在等离子体物理和霍尔效应推进器的研究中。这些工作包括对Mistral-Large-Instruct-2411模型的进一步优化,以及在多模态输出生成方面的创新应用。此外,该数据集还为其他相关领域的研究提供了参考,如电磁流体动力学和等离子体诊断技术,推动了跨学科的研究合作。
数据集最近研究
最新研究方向
在电动力学领域,特别是霍尔效应推进器中的应用,该数据集的最新研究方向聚焦于通过多模态数据增强大型语言模型的推理与问题解决能力。研究者们致力于将理论物理、计算模拟和实验数据相结合,以提升模型在等离子体物理和先进推进系统中的表现。这一方向不仅推动了AI在科学研究中的应用,还为未来太空探索和高效能源系统的设计提供了新的可能性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作