enpaiva/llama3-8B_synthetic_cultura-guarani_v.0.1
收藏Hugging Face2024-06-16 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/enpaiva/llama3-8B_synthetic_cultura-guarani_v.0.1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如索引、参考文献、问题、上下文、答案、答案生成者、问题生成者、问题类型、国家、语言和时期等。数据集仅包含训练集,共有9325个示例,总大小为12368023字节。
This dataset includes multiple feature fields such as index, references, questions, context, answers, answer generators, question generators, question type, country, language, and period. The dataset contains only a training set with 9325 examples and a total size of 12368023 bytes.
提供机构:
enpaiva
原始信息汇总
数据集概述
许可证
- 许可证类型:CC BY-SA 4.0
数据集信息
特征
- index: 数据类型为
int64 - referencias: 数据类型为
string - preguntas: 数据类型为
string - contexto: 数据类型为
string,且为序列类型 - respuestas: 数据类型为
string - respuestas_generadas_por: 数据类型为
string - preguntas_generadas_por: 数据类型为
string - tipo_de_pregunta: 数据类型为
string - pais: 数据类型为
string - idioma: 数据类型为
string - periodo: 数据类型为
string
数据分割
- train: 包含 9325 个样本,数据大小为 12368023 字节
数据集大小
- 下载大小:1883154 字节
- 数据集大小:12368023 字节
配置
- default: 包含训练数据文件,路径为
data/train-*



