andreabac3/StackOverflow-Italian-Fauno-Baize
收藏Hugging Face2023-04-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/andreabac3/StackOverflow-Italian-Fauno-Baize
下载链接
链接失效反馈官方服务:
资源简介:
StackOverflow-Italian-Fauno-Baize数据集是Baize作者提出的StackOverflow数据集的意大利语翻译版本。该数据集包含57,046个句子,平均每个对话有3.6轮,每轮对话的响应长度为36.0个字符。数据集的结构包括主题和输入两个字段,并且仅包含训练集。数据集的创建基于Baize聊天机器人的初始数据收集和规范化过程。数据集的维护者包括Andrea Bacciu、Giovanni Trappolini、Andrea Santilli和Fabrizio Silvestri。数据集遵循Baize创建者的许可约束,并提供了相关的引用信息。
StackOverflow-Italian-Fauno-Baize数据集是Baize作者提出的StackOverflow数据集的意大利语翻译版本。该数据集包含57,046个句子,平均每个对话有3.6轮,每轮对话的响应长度为36.0个字符。数据集的结构包括主题和输入两个字段,并且仅包含训练集。数据集的创建基于Baize聊天机器人的初始数据收集和规范化过程。数据集的维护者包括Andrea Bacciu、Giovanni Trappolini、Andrea Santilli和Fabrizio Silvestri。数据集遵循Baize创建者的许可约束,并提供了相关的引用信息。
提供机构:
andreabac3
原始信息汇总
StackOverflow-Italian-Fauno-Baize 数据集概述
数据集描述
- 语言:意大利语
- 论文:arXiv:2304.01196
数据集结构
数据实例
- 句子数量:57,046
- 平均对话轮数:3.6
- 每轮回复长度:36.0
数据字段
- 主题
- 输入
数据分割
- 训练集
数据集创建
源数据
- 初始数据收集和规范化:Baize 聊天机器人项目
许可证
- 许可证:GPL-3.0



