RiTA-nlp/tagengo-gpt4-italian
收藏Hugging Face2024-07-04 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/RiTA-nlp/tagengo-gpt4-italian
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含对话数据,每个对话有唯一的对话ID、语言信息、语言检测结果(包括检测到的语言和得分)、响应内容以及消息列表(包含消息内容和角色)。数据集仅包含一个训练集,共有6880个样本,总大小为27691484字节。
This dataset contains conversational data, each with a unique conversation ID, language information, language detection results (including detected language and score), response content, and a list of messages (including message content and role). The dataset includes only a training set with 6880 samples, totaling 27691484 bytes in size.
提供机构:
RiTA-nlp
原始信息汇总
数据集概述
许可证
- CC BY 4.0
数据集信息
-
特征:
conversation_id:字符串类型language:字符串类型lang_detect_result:结构体类型,包含以下字段:lang:字符串类型score:浮点数类型(float64)
response:字符串序列类型messages:列表类型,包含以下字段:content:字符串类型role:字符串类型
-
分割:
train:包含7063个样本,占用27732455字节
数据集大小
- 下载大小:15965434字节
- 数据集大小:27732455字节
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:



