five

andreabac3/StackOverflow-Italian-Fauno-Baize

收藏
Hugging Face2023-04-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/andreabac3/StackOverflow-Italian-Fauno-Baize
下载链接
链接失效反馈
官方服务:
资源简介:
StackOverflow-Italian-Fauno-Baize数据集是Baize作者提出的StackOverflow数据集的意大利语翻译版本。该数据集包含57,046个句子,平均每个对话有3.6轮,每轮对话的响应长度为36.0个字符。数据集的结构包括主题和输入两个字段,并且仅包含训练集。数据集的创建基于Baize聊天机器人的初始数据收集和规范化过程。数据集的维护者包括Andrea Bacciu、Giovanni Trappolini、Andrea Santilli和Fabrizio Silvestri。数据集遵循Baize创建者的许可约束,并提供了相关的引用信息。

StackOverflow-Italian-Fauno-Baize数据集是Baize作者提出的StackOverflow数据集的意大利语翻译版本。该数据集包含57,046个句子,平均每个对话有3.6轮,每轮对话的响应长度为36.0个字符。数据集的结构包括主题和输入两个字段,并且仅包含训练集。数据集的创建基于Baize聊天机器人的初始数据收集和规范化过程。数据集的维护者包括Andrea Bacciu、Giovanni Trappolini、Andrea Santilli和Fabrizio Silvestri。数据集遵循Baize创建者的许可约束,并提供了相关的引用信息。
提供机构:
andreabac3
原始信息汇总

StackOverflow-Italian-Fauno-Baize 数据集概述

数据集描述

数据集结构

数据实例

  • 句子数量:57,046
  • 平均对话轮数:3.6
  • 每轮回复长度:36.0

数据字段

  • 主题
  • 输入

数据分割

  • 训练集

数据集创建

源数据

许可证

  • 许可证:GPL-3.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作