dariolopez/argilla-reddit-c-ssrs-suicide-dataset-es-old
收藏Hugging Face2023-03-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dariolopez/argilla-reddit-c-ssrs-suicide-dataset-es-old
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: inputs
struct:
- name: text
dtype: string
- name: prediction
dtype: 'null'
- name: prediction_agent
dtype: 'null'
- name: annotation
dtype: string
- name: annotation_agent
dtype: string
- name: vectors
struct:
- name: all-MiniLM-L6-v2
sequence: float64
- name: multi_label
dtype: bool
- name: explanation
dtype: 'null'
- name: id
dtype: string
- name: metadata
dtype: 'null'
- name: status
dtype: string
- name: event_timestamp
dtype: timestamp[us]
- name: metrics
struct:
- name: text_length
dtype: int64
splits:
- name: train
num_bytes: 60733
num_examples: 14
download_size: 61140
dataset_size: 60733
task_categories:
- text-classification
size_categories:
- 1K<n<10K
language:
- es
---
# Dataset Validated from https://huggingface.co/spaces/dariolopez/argilla-reddit-c-ssrs-suicide-dataset-es
https://huggingface.co/spaces/dariolopez/argilla-reddit-c-ssrs-suicide-dataset-es
提供机构:
dariolopez
原始信息汇总
数据集概述
数据集特征
- text: 数据类型为字符串。
- inputs: 结构化数据,包含子特征
text,数据类型为字符串。 - prediction: 数据类型为空。
- prediction_agent: 数据类型为空。
- annotation: 数据类型为字符串。
- annotation_agent: 数据类型为字符串。
- vectors: 结构化数据,包含子特征
all-MiniLM-L6-v2,数据类型为浮点数序列。 - multi_label: 数据类型为布尔值。
- explanation: 数据类型为空。
- id: 数据类型为字符串。
- metadata: 数据类型为空。
- status: 数据类型为字符串。
- event_timestamp: 数据类型为时间戳(微秒)。
- metrics: 结构化数据,包含子特征
text_length,数据类型为整数。
数据集划分
- train: 数据集大小为60733字节,包含14个样本。
数据集大小
- 下载大小: 61140字节
- 数据集大小: 60733字节
任务类别
- 文本分类
大小类别
- 1K<n<10K
语言
- 西班牙语(es)



