dvilasuero/somos-clean-alpaca-es-herrius
收藏Hugging Face2023-03-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dvilasuero/somos-clean-alpaca-es-herrius
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: 'null'
- name: inputs
struct:
- name: 1-instruction
dtype: string
- name: 2-input
dtype: string
- name: 3-output
dtype: string
- name: prediction
dtype: 'null'
- name: prediction_agent
dtype: 'null'
- name: annotation
dtype: string
- name: annotation_agent
dtype: string
- name: vectors
struct:
- name: input
sequence: float64
- name: instruction
sequence: float64
- name: output
sequence: float64
- name: multi_label
dtype: bool
- name: explanation
dtype: 'null'
- name: id
dtype: string
- name: metadata
dtype: 'null'
- name: status
dtype: string
- name: event_timestamp
dtype: timestamp[us]
- name: metrics
struct:
- name: text_length
dtype: int64
splits:
- name: train
num_bytes: 1821652
num_examples: 96
download_size: 1475326
dataset_size: 1821652
---
# Dataset Card for "somos-clean-alpaca-es-herrius"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征:
- 字段名:text,数据类型:空类型(null)
- 字段名:inputs,结构体类型:
- 字段名:1-instruction,数据类型:字符串(string)
- 字段名:2-input,数据类型:字符串(string)
- 字段名:3-output,数据类型:字符串(string)
- 字段名:prediction,数据类型:空类型(null)
- 字段名:prediction_agent,数据类型:空类型(null)
- 字段名:annotation,数据类型:字符串(string)
- 字段名:annotation_agent,数据类型:字符串(string)
- 字段名:vectors,结构体类型:
- 字段名:input,float64类型序列
- 字段名:instruction,float64类型序列
- 字段名:output,float64类型序列
- 字段名:multi_label,数据类型:布尔类型(bool)
- 字段名:explanation,数据类型:空类型(null)
- 字段名:id,数据类型:字符串(string)
- 字段名:metadata,数据类型:空类型(null)
- 字段名:status,数据类型:字符串(string)
- 字段名:event_timestamp,数据类型:微秒级时间戳(timestamp[us])
- 字段名:metrics,结构体类型:
- 字段名:text_length(文本长度),数据类型:int64类型
数据集划分:
- 划分名称:train,占用字节数:1821652,样本总数:96
下载大小:1475326
数据集总大小:1821652
# 「somos-clean-alpaca-es-herrius」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
dvilasuero
原始信息汇总
数据集概述
数据集名称
- 名称: somos-clean-alpaca-es-herrius
数据集特征
- text: 数据类型为
null - inputs: 结构化数据,包含以下子特征:
- 1-instruction: 数据类型为
string - 2-input: 数据类型为
string - 3-output: 数据类型为
string
- 1-instruction: 数据类型为
- prediction: 数据类型为
null - prediction_agent: 数据类型为
null - annotation: 数据类型为
string - annotation_agent: 数据类型为
string - vectors: 结构化数据,包含以下子特征:
- input: 序列类型为
float64 - instruction: 序列类型为
float64 - output: 序列类型为
float64
- input: 序列类型为
- multi_label: 数据类型为
bool - explanation: 数据类型为
null - id: 数据类型为
string - metadata: 数据类型为
null - status: 数据类型为
string - event_timestamp: 数据类型为
timestamp[us] - metrics: 结构化数据,包含以下子特征:
- text_length: 数据类型为
int64
- text_length: 数据类型为
数据集分割
- train:
- num_bytes: 1821652
- num_examples: 96
数据集大小
- download_size: 1475326
- dataset_size: 1821652



