five

davanstrien/AiGen-FoodReview

收藏
Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/AiGen-FoodReview
下载链接
链接失效反馈
官方服务:
资源简介:
AiGen-FoodReview是一个多模态数据集,包含机器生成的餐厅评论和社交媒体图片。数据集的特征包括ID、文本、标签、可读性指数、难词数量、阅读时间等。数据集分为训练集、测试集和验证集,分别包含12086、4030和4028个示例。数据集的下载大小为1836929866字节,总大小为2133459299.6020002字节。

AiGen-FoodReview is a multimodal dataset consisting of machine-generated restaurant reviews and social media images. The dataset includes features such as ID, text, label, readability index, number of difficult words, and reading time. It is split into training, test, and validation sets, which contain 12086, 4030, and 4028 samples respectively. The download size of the dataset is 1836929866 bytes, and the total storage size is 2133459299.6020002 bytes.
提供机构:
davanstrien
原始信息汇总

数据集概述

数据集信息

特征

  • ID: 数据类型为 int64
  • text: 数据类型为 string
  • label: 数据类型为 int64
  • automated_readability_index: 数据类型为 float64
  • difficult_words: 数据类型为 int64
  • flesch_reading_ease: 数据类型为 float64
  • gunning_fog: 数据类型为 float64
  • words_per_sentence: 数据类型为 float64
  • reading_time: 数据类型为 float64
  • ppl: 数据类型为 float64
  • bright: 数据类型为 float64
  • cont: 数据类型为 float64
  • warm: 数据类型为 float64
  • colorf: 数据类型为 float64
  • sd: 数据类型为 float64
  • cd: 数据类型为 float64
  • td: 数据类型为 float64
  • diag_dom: 数据类型为 float64
  • rot: 数据类型为 float64
  • hpvb: 数据类型为 float64
  • vpvb: 数据类型为 float64
  • hcvb: 数据类型为 float64
  • vcvb: 数据类型为 float64
  • sat: 数据类型为 float64
  • clar: 数据类型为 float64
  • image: 数据类型为 image

数据分割

  • train: 包含 12086 个样本,大小为 1260144919.2 字节
  • test: 包含 4030 个样本,大小为 432615568.19 字节
  • valid: 包含 4028 个样本,大小为 440698812.212 字节

数据集大小

  • 下载大小: 1836929866 字节
  • 数据集大小: 2133459299.6020002 字节

配置

  • config_name: default
    • 数据文件路径:
      • train: data/train-*
      • test: data/test-*
      • valid: data/valid-*

许可证

  • license: MIT

语言

  • language: 英语 (en)

数据集名称

  • pretty_name: AiGen-FoodReview: A Multimodal Dataset of Machine-Generated Restaurant Reviews and Images on Social Media
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作