Weni/zeroshot-sft-3.3.0

Name: Weni/zeroshot-sft-3.3.0
Creator: Weni
Published: 2024-07-12 07:53:30
License: 暂无描述

Hugging Face2024-07-12 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/Weni/zeroshot-sft-3.3.0

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征，包括上下文（context）、所有类别（all_classes）、输入（input）、输出（output）、输出ID（output_id）、语言（language）和数据类别（data_category）。其中，all_classes是一个列表，包含类别（class）、上下文（context）和ID（id）三个子特征。language和data_category是分类标签，分别表示语言和数据类别。数据集包含一个训练集（train），包含20847个样本，总大小为22160369字节。

The dataset includes multiple features such as context, all_classes, input, output, output_id, language, and data_category. Among these, all_classes is a list containing three sub-features: class, context, and id. language and data_category are class labels representing language and data category, respectively. The dataset contains a training set (train) with 20,847 samples and a total size of 22,160,369 bytes.

提供机构：

Weni

原始信息汇总

数据集概述

数据特征

context: 数据类型为字符串。
all_classes: 包含以下子特征：
- class: 数据类型为字符串。
- context: 数据类型为字符串。
- id: 数据类型为整数（int64）。
input: 数据类型为字符串。
output: 数据类型为字符串。
output_id: 数据类型为整数（int64）。
language: 数据类型为类别标签，包含以下类别：
- 0: pt（葡萄牙语）
- 1: en（英语）
- 2: es（西班牙语）

数据分割

train: 包含20847个样本，占用21993593字节。

数据集大小

下载大小: 6710622字节
数据集大小: 21993593字节

配置

default: 包含训练数据文件，路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集