five

sumyeongahn/yelp

收藏
Hugging Face2024-06-15 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/sumyeongahn/yelp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个部分:训练集、测试集和调试集。每个部分都包含索引、标签、句子和释义四个特征。训练集有30000个示例,测试集有3000个示例,调试集有5000个示例。数据集的下载大小为24903931字节,总大小为40226541字节。

The dataset consists of three parts: train, test, and debug. Each part includes four features: idx, label, sentence, and paraphrase. The train set has 30,000 examples, the test set has 3,000 examples, and the debug set has 5,000 examples. The download size of the dataset is 24,903,931 bytes, and the total size is 40,226,541 bytes.
提供机构:
sumyeongahn
原始信息汇总

数据集概述

数据集特征

  • idx: 整数类型
  • label: 整数类型
  • sentence: 字符串类型
  • paraphrase: 字符串类型

数据集分割

  • train:
    • 字节数: 31786747
    • 样本数: 30000
  • test:
    • 字节数: 3169249
    • 样本数: 3000
  • debug:
    • 字节数: 5270545
    • 样本数: 5000

数据集大小

  • 下载大小: 24903931 字节
  • 总大小: 40226541 字节

配置

  • config_name: default
    • 数据文件:
      • train: data/train-*
      • test: data/test-*
      • debug: data/debug-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作