efederici/fisica
收藏Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/efederici/fisica
下载链接
链接失效反馈官方服务:
资源简介:
Fisica是一个专注于物理学的意大利语问答数据集,包含大约28,000个问答对,使用Claude和GPT-4生成。该数据集旨在促进意大利语大型语言模型的研究和开发。数据集涵盖了广泛的物理主题,提供了高质量的问答对,专门为意大利语设计。数据来源包括使用Claude Opus生成的8000对问答和从camel-ai/physics数据集翻译的20000对问答。
Fisica是一个专注于物理学的意大利语问答数据集,包含大约28,000个问答对,使用Claude和GPT-4生成。该数据集旨在促进意大利语大型语言模型的研究和开发。数据集涵盖了广泛的物理主题,提供了高质量的问答对,专门为意大利语设计。数据来源包括使用Claude Opus生成的8000对问答和从camel-ai/physics数据集翻译的20000对问答。
提供机构:
efederici
原始信息汇总
数据集概述
基本信息
- 名称: Fisica
- 语言: 意大利语
- 任务类别:
- 问答
- 文本生成
- 标签:
- 物理学
- Opus
- 人类学
- GPT-4
- 大小类别: 10K<n<100K
数据集内容
- 特征:
- 问题 (question): 字符串类型
- 答案 (answer): 字符串类型
- 来源 (source): 字符串类型
- 分割:
- 训练集 (train):
- 示例数量: 27999
- 数据大小: 71518930字节
- 下载大小: 35743633字节
- 训练集 (train):
数据集描述
- 目的: 促进意大利语大型语言模型(LLMs)的研究和开发
- 内容特点:
- 涵盖广泛的物理学主题
- 高质量的问答对,使用Claude Opus和Claude Sonnet生成
- 专为意大利语设计
数据来源
- 约8,000对问答使用Claude Opus从种子主题列表生成
- 20,000对问答使用Claude Sonnet从camel-ai/physics GPT-4数据集翻译而来



