alvations/dslml24-jelly-submission-pt
收藏Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/alvations/dslml24-jelly-submission-pt
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: dev
features:
- name: text
dtype: string
- name: label
dtype: string
- name: prediction_oneshot
dtype: string
- name: response_oneshot
list:
- name: generated_text
dtype: string
- name: dataset
dtype: string
- name: split
dtype: string
- name: lang
dtype: string
splits:
- name: train
num_bytes: 1843139
num_examples: 991
download_size: 585205
dataset_size: 1843139
- config_name: test
features:
- name: text
dtype: string
- name: prediction_oneshot
dtype: string
- name: response_oneshot
list:
- name: generated_text
dtype: string
- name: dataset
dtype: string
- name: split
dtype: string
- name: lang
dtype: string
splits:
- name: train
num_bytes: 920259
num_examples: 495
download_size: 298742
dataset_size: 920259
- config_name: train
features:
- name: text
dtype: string
- name: label
dtype: string
- name: prediction_oneshot
dtype: string
- name: response_oneshot
list:
- name: generated_text
dtype: string
- name: dataset
dtype: string
- name: split
dtype: string
- name: lang
dtype: string
splits:
- name: train
num_bytes: 6439867
num_examples: 3467
download_size: 2040472
dataset_size: 6439867
configs:
- config_name: dev
data_files:
- split: train
path: dev/train-*
- config_name: test
data_files:
- split: train
path: test/train-*
- config_name: train
data_files:
- split: train
path: train/train-*
---
提供机构:
alvations
原始信息汇总
数据集概述
配置名称:dev
- 特征信息:
- text: 数据类型为字符串
- label: 数据类型为字符串
- prediction_oneshot: 数据类型为字符串
- response_oneshot: 包含一个名为generated_text的子特征,数据类型为字符串
- dataset: 数据类型为字符串
- split: 数据类型为字符串
- lang: 数据类型为字符串
- 数据分割信息:
- train: 数据大小为1843139字节,包含991个样本
- 下载大小为585205字节,数据集总大小为1843139字节
配置名称:test
- 特征信息:
- text: 数据类型为字符串
- prediction_oneshot: 数据类型为字符串
- response_oneshot: 包含一个名为generated_text的子特征,数据类型为字符串
- dataset: 数据类型为字符串
- split: 数据类型为字符串
- lang: 数据类型为字符串
- 数据分割信息:
- train: 数据大小为920259字节,包含495个样本
- 下载大小为298742字节,数据集总大小为920259字节
配置名称:train
- 特征信息:
- text: 数据类型为字符串
- label: 数据类型为字符串
- prediction_oneshot: 数据类型为字符串
- response_oneshot: 包含一个名为generated_text的子特征,数据类型为字符串
- dataset: 数据类型为字符串
- split: 数据类型为字符串
- lang: 数据类型为字符串
- 数据分割信息:
- train: 数据大小为6439867字节,包含3467个样本
- 下载大小为2040472字节,数据集总大小为6439867字节



