C-MTEB/OnlineShopping-classification
收藏Hugging Face2023-07-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/C-MTEB/OnlineShopping-classification
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
dataset_info:
features:
- name: cat
dtype: string
- name: label
dtype: int64
- name: text
dtype: string
splits:
- name: train
num_bytes: 1535074.0115334373
num_examples: 8000
- name: test
num_bytes: 191884.25144167966
num_examples: 1000
download_size: 1139002
dataset_size: 1726958.262975117
---
# Dataset Card for "OnlineShopping-classification"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
C-MTEB
原始信息汇总
数据集概述
数据集配置
- 配置名称: default
- 数据文件:
- 训练集: data/train-*
- 测试集: data/test-*
数据集信息
- 特征:
- 名称: cat
- 数据类型: string
- 名称: label
- 数据类型: int64
- 名称: text
- 数据类型: string
- 名称: cat
- 拆分:
- 训练集:
- 字节数: 1535074.0115334373
- 样本数: 8000
- 测试集:
- 字节数: 191884.25144167966
- 样本数: 1000
- 训练集:
- 下载大小: 1139002
- 数据集大小: 1726958.262975117
搜集汇总
背景与挑战
背景概述
该数据集是C-MTEB中文大规模文本嵌入基准的一部分,专注于中文在线购物评论的二分类任务,包含9,000条文本数据,涵盖多个商品类别,用于评估文本嵌入模型的性能。数据集分为训练集和测试集,标签表示评论的情感倾向(如正面或负面),适用于自然语言处理中的分类和情感分析研究。
以上内容由遇见数据集搜集并总结生成



