five

enpaiva/llama3-8B_synthetic_cultura-guarani_v.0.1

收藏
Hugging Face2024-06-16 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/enpaiva/llama3-8B_synthetic_cultura-guarani_v.0.1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征字段,如索引、参考文献、问题、上下文、答案、答案生成者、问题生成者、问题类型、国家、语言和时期等。数据集仅包含训练集,共有9325个示例,总大小为12368023字节。

This dataset includes multiple feature fields such as index, references, questions, context, answers, answer generators, question generators, question type, country, language, and period. The dataset contains only a training set with 9325 examples and a total size of 12368023 bytes.
提供机构:
enpaiva
原始信息汇总

数据集概述

许可证

  • 许可证类型:CC BY-SA 4.0

数据集信息

特征

  • index: 数据类型为 int64
  • referencias: 数据类型为 string
  • preguntas: 数据类型为 string
  • contexto: 数据类型为 string,且为序列类型
  • respuestas: 数据类型为 string
  • respuestas_generadas_por: 数据类型为 string
  • preguntas_generadas_por: 数据类型为 string
  • tipo_de_pregunta: 数据类型为 string
  • pais: 数据类型为 string
  • idioma: 数据类型为 string
  • periodo: 数据类型为 string

数据分割

  • train: 包含 9325 个样本,数据大小为 12368023 字节

数据集大小

  • 下载大小:1883154 字节
  • 数据集大小:12368023 字节

配置

  • default: 包含训练数据文件,路径为 data/train-*
二维码
社区交流群
二维码
科研交流群
商业服务