five

efederici/fisica

收藏
Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/efederici/fisica
下载链接
链接失效反馈
官方服务:
资源简介:
Fisica是一个专注于物理学的意大利语问答数据集,包含大约28,000个问答对,使用Claude和GPT-4生成。该数据集旨在促进意大利语大型语言模型的研究和开发。数据集涵盖了广泛的物理主题,提供了高质量的问答对,专门为意大利语设计。数据来源包括使用Claude Opus生成的8000对问答和从camel-ai/physics数据集翻译的20000对问答。

Fisica是一个专注于物理学的意大利语问答数据集,包含大约28,000个问答对,使用Claude和GPT-4生成。该数据集旨在促进意大利语大型语言模型的研究和开发。数据集涵盖了广泛的物理主题,提供了高质量的问答对,专门为意大利语设计。数据来源包括使用Claude Opus生成的8000对问答和从camel-ai/physics数据集翻译的20000对问答。
提供机构:
efederici
原始信息汇总

数据集概述

基本信息

  • 名称: Fisica
  • 语言: 意大利语
  • 任务类别:
    • 问答
    • 文本生成
  • 标签:
    • 物理学
    • Opus
    • 人类学
    • GPT-4
  • 大小类别: 10K<n<100K

数据集内容

  • 特征:
    • 问题 (question): 字符串类型
    • 答案 (answer): 字符串类型
    • 来源 (source): 字符串类型
  • 分割:
    • 训练集 (train):
      • 示例数量: 27999
      • 数据大小: 71518930字节
      • 下载大小: 35743633字节

数据集描述

  • 目的: 促进意大利语大型语言模型(LLMs)的研究和开发
  • 内容特点:
    • 涵盖广泛的物理学主题
    • 高质量的问答对,使用Claude Opus和Claude Sonnet生成
    • 专为意大利语设计

数据来源

  • 约8,000对问答使用Claude Opus从种子主题列表生成
  • 20,000对问答使用Claude Sonnet从camel-ai/physics GPT-4数据集翻译而来
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作