five

RiTA-nlp/tagengo-gpt4-italian

收藏
Hugging Face2024-07-04 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/RiTA-nlp/tagengo-gpt4-italian
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含对话数据,每个对话有唯一的对话ID、语言信息、语言检测结果(包括检测到的语言和得分)、响应内容以及消息列表(包含消息内容和角色)。数据集仅包含一个训练集,共有6880个样本,总大小为27691484字节。

This dataset contains conversational data, each with a unique conversation ID, language information, language detection results (including detected language and score), response content, and a list of messages (including message content and role). The dataset includes only a training set with 6880 samples, totaling 27691484 bytes in size.
提供机构:
RiTA-nlp
原始信息汇总

数据集概述

许可证

  • CC BY 4.0

数据集信息

  • 特征

    • conversation_id:字符串类型
    • language:字符串类型
    • lang_detect_result:结构体类型,包含以下字段:
      • lang:字符串类型
      • score:浮点数类型(float64)
    • response:字符串序列类型
    • messages:列表类型,包含以下字段:
      • content:字符串类型
      • role:字符串类型
  • 分割

    • train:包含7063个样本,占用27732455字节

数据集大小

  • 下载大小:15965434字节
  • 数据集大小:27732455字节

配置

  • 默认配置
    • 数据文件路径:data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作