alarcon7a/somos-clean-alpaca-es-validations
收藏Hugging Face2023-04-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alarcon7a/somos-clean-alpaca-es-validations
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: 'null'
- name: inputs
struct:
- name: 1-instruction
dtype: string
- name: 2-input
dtype: string
- name: 3-output
dtype: string
- name: prediction
dtype: 'null'
- name: prediction_agent
dtype: 'null'
- name: annotation
dtype: string
- name: annotation_agent
dtype: string
- name: vectors
struct:
- name: input
sequence: float64
- name: instruction
sequence: float64
- name: output
sequence: float64
- name: multi_label
dtype: bool
- name: explanation
dtype: 'null'
- name: id
dtype: string
- name: metadata
dtype: 'null'
- name: status
dtype: string
- name: event_timestamp
dtype: timestamp[us]
- name: metrics
struct:
- name: text_length
dtype: int64
splits:
- name: train
num_bytes: 739721
num_examples: 39
download_size: 0
dataset_size: 739721
---
# Dataset Card for "somos-clean-alpaca-es-validations"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
### 数据集信息
#### 特征字段:
- 字段名:`text`,数据类型:空(null)
- 字段名:`inputs`,结构体类型,包含子字段:
- 字段名:`1-instruction`,数据类型:字符串
- 字段名:`2-input`,数据类型:字符串
- 字段名:`3-output`,数据类型:字符串
- 字段名:`prediction`,数据类型:空(null)
- 字段名:`prediction_agent`,数据类型:空(null)
- 字段名:`annotation`,数据类型:字符串
- 字段名:`annotation_agent`,数据类型:字符串
- 字段名:`vectors`,结构体类型,包含子字段:
- 字段名:`input`,序列类型:float64
- 字段名:`instruction`,序列类型:float64
- 字段名:`output`,序列类型:float64
- 字段名:`multi_label`,数据类型:布尔型(bool)
- 字段名:`explanation`,数据类型:空(null)
- 字段名:`id`,数据类型:字符串
- 字段名:`metadata`,数据类型:空(null)
- 字段名:`status`,数据类型:字符串
- 字段名:`event_timestamp`,数据类型:微秒级时间戳(timestamp[us])
- 字段名:`metrics`,结构体类型,包含子字段:
- 字段名:`text_length`,数据类型:int64
#### 数据集划分:
- 划分名称:`train`(训练集),字节占用量:739721,样本数量:39
- 下载大小:0
- 数据集总大小:739721
---
# "somos-clean-alpaca-es-validations" 数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
alarcon7a
原始信息汇总
数据集概述
数据集名称
- 名称: somos-clean-alpaca-es-validations
数据集特征
- text: 数据类型为
null。 - inputs: 结构化数据,包含以下字段:
- 1-instruction: 数据类型为
string。 - 2-input: 数据类型为
string。 - 3-output: 数据类型为
string。
- 1-instruction: 数据类型为
- prediction: 数据类型为
null。 - prediction_agent: 数据类型为
null。 - annotation: 数据类型为
string。 - annotation_agent: 数据类型为
string。 - vectors: 结构化数据,包含以下字段:
- input: 序列类型为
float64。 - instruction: 序列类型为
float64。 - output: 序列类型为
float64。
- input: 序列类型为
- multi_label: 数据类型为
bool。 - explanation: 数据类型为
null。 - id: 数据类型为
string。 - metadata: 数据类型为
null。 - status: 数据类型为
string。 - event_timestamp: 数据类型为
timestamp[us]。 - metrics: 结构化数据,包含以下字段:
- text_length: 数据类型为
int64。
- text_length: 数据类型为
数据集分割
- train:
- num_bytes: 739721
- num_examples: 39
数据集大小
- download_size: 0
- dataset_size: 739721



