efederici/capybara-claude-15k-ita
收藏Hugging Face2024-05-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/efederici/capybara-claude-15k-ita
下载链接
链接失效反馈官方服务:
资源简介:
这是一个意大利语的多轮对话数据集,源自翻译的capybara初始提示。通过管道生成答案和后续指令(1-2-3)来创建每个对话轮次。指令和答案分别由claude-3-sonnet-20240229和claude-3-opus-20240229生成。数据集的策划者为Edoardo Federici,语言为意大利语,许可证为MIT。
这是一个意大利语的多轮对话数据集,源自翻译的capybara初始提示。通过管道生成答案和后续指令(1-2-3)来创建每个对话轮次。指令和答案分别由claude-3-sonnet-20240229和claude-3-opus-20240229生成。数据集的策划者为Edoardo Federici,语言为意大利语,许可证为MIT。
提供机构:
efederici
原始信息汇总
数据集概述
基本信息
- 语言: 意大利语
- 许可证: MIT
- 数据集大小分类: 10K<n<100K
- 任务分类:
- 问答
- 文本生成
数据集结构
特征
- hash: 字符串类型
- conversations: 列表类型
- content: 字符串类型
- role: 字符串类型
分割
- train:
- 字节数: 104144365
- 样本数: 14680
下载与数据集大小
- 下载大小: 54685714
- 数据集大小: 104144365
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
标签
- synthetic
数据集描述
该数据集是一个意大利语的多轮对话数据集,由翻译自capybara的初始提示演变而来。通过将初始提示通过一个管道生成答案和后续指令(1-2-3)来创建每个对话轮次。
指令使用claude-3-sonnet-20240229创建和翻译,答案由claude-3-opus-20240229生成。
数据集引用
该数据集由Edoardo Federici策划。



