five

fmuia/StringPheno

收藏
Hugging Face2024-02-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fmuia/StringPheno
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专注于弦现象学领域,通过处理该领域的知名论文,利用OpenAI的ChatGPT 3.5 Turbo生成技术性问题,旨在增强Llama模型在该领域的能力。目前数据集包含2600个技术问答,并计划增加更多内容。数据集来源于多篇弦现象学领域的论文,包括但不限于F. Denef等人的《Physics of String Flux Compactifications》、M. Cicoli等人的《String cosmology: From the early universe to today》等。

该数据集专注于弦现象学领域,通过处理该领域的知名论文,利用OpenAI的ChatGPT 3.5 Turbo生成技术性问题,旨在增强Llama模型在该领域的能力。目前数据集包含2600个技术问答,并计划增加更多内容。数据集来源于多篇弦现象学领域的论文,包括但不限于F. Denef等人的《Physics of String Flux Compactifications》、M. Cicoli等人的《String cosmology: From the early universe to today》等。
提供机构:
fmuia
原始信息汇总

弦现象学数据集及LLM微调

项目概述

本正在进行中的仓库致力于围绕弦现象学领域创建一个专门的数据集,重点关注塑造该领域的重要论文。目前包含2600个关于弦现象学的技术性问答,但我们计划使用该领域更多有影响力的论文来增加数据集的内容。

数据集创建

数据集是从弦现象学领域的一系列有影响力论文中构建的。每篇论文被分割成若干部分,然后通过OpenAI的ChatGPT 3.5 Turbo进行处理。这一先进的语言模型被用来根据每篇论文内容生成技术级别的问题,确保一个丰富、上下文相关的数据集,旨在增强Llama模型在弦现象学领域的能力。

包含的论文

数据集包含以下论文:

我们计划包含该领域更多的论文。

功能和计划实施

当前功能

  • 弦现象学关键论文的数据集

待添加功能

  • 增强数据预处理以优化模型输入。例如,目前许多问题涉及论文文本,我们希望避免这种情况。
  • 扩展数据集,包括更多论文和资源。
  • 保留引用(包括例如arXiv编号,在必要时)

合作和反馈

我们邀请研究人员、爱好者和开发者为这个项目做出贡献。

如何贡献

  • 添加到数据集:如果您有建议的论文或内容应包含在内,请打开一个问题或提交一个拉取请求。
  • 功能建议:有新功能或实施的想法吗?让我们在问题部分讨论它们!

反馈

请分享您的想法、建设性批评或您遇到的任何问题的报告。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作