alvations/esci-data-task2
收藏Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvations/esci-data-task2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: example_id
dtype: int64
- name: query
dtype: string
- name: query_id
dtype: int64
- name: product_id
dtype: string
- name: product_locale
dtype: string
- name: esci_label
dtype: string
- name: small_version
dtype: int64
- name: large_version
dtype: int64
- name: split
dtype: string
- name: product_title
dtype: string
- name: product_description
dtype: string
- name: product_bullet_point
dtype: string
- name: product_brand
dtype: string
- name: product_color
dtype: string
- name: gain
dtype: float64
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 2603008323
num_examples: 1977767
- name: dev
num_bytes: 7386427
num_examples: 5505
- name: test
num_bytes: 843102586
num_examples: 638016
download_size: 2214316591
dataset_size: 3453497336
---
# Dataset Card for "esci-data-task2"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
alvations
原始信息汇总
数据集概述
数据集名称
esci-data-task2
数据集特征
- example_id: 整数类型
- query: 字符串类型
- query_id: 整数类型
- product_id: 字符串类型
- product_locale: 字符串类型
- esci_label: 字符串类型
- small_version: 整数类型
- large_version: 整数类型
- split: 字符串类型
- product_title: 字符串类型
- product_description: 字符串类型
- product_bullet_point: 字符串类型
- product_brand: 字符串类型
- product_color: 字符串类型
- gain: 浮点数类型
- index_level_0: 整数类型
数据集分割
- 训练集 (train):
- 示例数量: 1977767
- 字节数: 2603008323
- 开发集 (dev):
- 示例数量: 5505
- 字节数: 7386427
- 测试集 (test):
- 示例数量: 638016
- 字节数: 843102586
数据集大小
- 下载大小: 2214316591 字节
- 数据集总大小: 3453497336 字节



