alvations/esci-data-task1
收藏Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvations/esci-data-task1
下载链接
链接失效反馈官方服务:
资源简介:
---
license: other
dataset_info:
features:
- name: example_id
dtype: int64
- name: query
dtype: string
- name: query_id
dtype: int64
- name: product_id
dtype: string
- name: product_locale
dtype: string
- name: esci_label
dtype: string
- name: small_version
dtype: int64
- name: large_version
dtype: int64
- name: split
dtype: string
- name: product_title
dtype: string
- name: product_description
dtype: string
- name: product_bullet_point
dtype: string
- name: product_brand
dtype: string
- name: product_color
dtype: string
- name: gain
dtype: float64
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 1030417721
num_examples: 777248
- name: dev
num_bytes: 5890341
num_examples: 4390
- name: test
num_bytes: 445424864
num_examples: 336373
download_size: 726913948
dataset_size: 1481732926
---
提供机构:
alvations
原始信息汇总
数据集概述
数据集特征
- example_id: 整数类型 (int64)
- query: 字符串类型 (string)
- query_id: 整数类型 (int64)
- product_id: 字符串类型 (string)
- product_locale: 字符串类型 (string)
- esci_label: 字符串类型 (string)
- small_version: 整数类型 (int64)
- large_version: 整数类型 (int64)
- split: 字符串类型 (string)
- product_title: 字符串类型 (string)
- product_description: 字符串类型 (string)
- product_bullet_point: 字符串类型 (string)
- product_brand: 字符串类型 (string)
- product_color: 字符串类型 (string)
- gain: 浮点数类型 (float64)
- index_level_0: 整数类型 (int64)
数据集分割
- train: 777,248个样本,占用1,030,417,721字节
- dev: 4,390个样本,占用5,890,341字节
- test: 336,373个样本,占用445,424,864字节
数据集大小
- 下载大小: 726,913,948字节
- 数据集总大小: 1,481,732,926字节



