andreabac3/Quora-Italian-Fauno-Baize
收藏Hugging Face2023-04-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/andreabac3/Quora-Italian-Fauno-Baize
下载链接
链接失效反馈官方服务:
资源简介:
Quora-Italian-Fauno-Baize数据集是Baize作者提出的Quora数据集的意大利语翻译版本。该数据集包含54,456个句子,平均每轮对话有3.9个回合,每个回合的响应长度为35.9个字符。数据字段包括主题和输入。数据集仅包含训练集。数据集的创建基于Baize聊天机器人项目的初始数据收集和规范化。数据集的维护者包括Andrea Bacciu、Giovanni Trappolini、Andrea Santilli和Fabrizio Silvestri。数据集遵循Baize创建者的许可约束,并提供了相关的引用信息。
Quora-Italian-Fauno-Baize数据集是Baize作者提出的Quora数据集的意大利语翻译版本。该数据集包含54,456个句子,平均每轮对话有3.9个回合,每个回合的响应长度为35.9个字符。数据字段包括主题和输入。数据集仅包含训练集。数据集的创建基于Baize聊天机器人项目的初始数据收集和规范化。数据集的维护者包括Andrea Bacciu、Giovanni Trappolini、Andrea Santilli和Fabrizio Silvestri。数据集遵循Baize创建者的许可约束,并提供了相关的引用信息。
提供机构:
andreabac3
原始信息汇总
Quora-Italian-Fauno-Baize 数据集概述
数据集描述
- 语言: 意大利语
- 数据结构:
- 数据实例: 54,456 个句子
- 平均对话轮数: 3.9 轮
- 每轮回复长度: 35.9 个词
- 数据字段:
- 主题
- 输入
- 数据分割:
- 训练集
数据集创建
- 来源数据: 原始数据来源于 Baize 项目
附加信息
-
数据集维护者:
- Andrea Bacciu
- Dr. Giovanni Trappolini
- Andrea Santilli
- Professor Fabrizio Silvestri
-
许可信息: 遵循 Baize 项目的许可约束,使用 GPL-3.0 许可证



