five

Pclanglais/MonadGPT

收藏
Hugging Face2023-11-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Pclanglais/MonadGPT
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc0-1.0 language: - en - fr - la --- This finetuning dataset has been used to train MonadGPT, a chatGPT-like model for the early modern period. It contains 10,797 excerpts of texts in English, French and Latin, mostly published in the 17th century, as well as synthetic questions generated by Mistral-Hermes. The instructions use the chatML format with a unique system prompt (to help with consistency), user questions and assistant answers. All the excerpts are in the public domain and so are the synthetic instructions (in accordance with recommendations from the US Copyright Office).
提供机构:
Pclanglais
原始信息汇总

数据集概述

数据集用途

  • 用于训练 MonadGPT,一个针对早期现代时期的类 chatGPT 模型。

数据内容

  • 包含 10,797 段文本摘录,语言包括英语、法语和拉丁语。
  • 这些文本主要出版于 17 世纪。
  • 还包括由 Mistral-Hermes 生成的合成问题。

数据格式

  • 使用 chatML 格式。
  • 包含独特的系统提示、用户问题和助手回答,以确保一致性。

版权信息

  • 所有摘录均为公共领域。
  • 合成指令也符合美国版权办公室的推荐,属于公共领域。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作