five

francepfl/driving-theory-exp

收藏
Hugging Face2024-06-19 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/francepfl/driving-theory-exp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含英语、法语和意大利语三种语言的配置,每种配置都包含id、images和conversation三个特性。images特性包含bytes和path,conversation特性包含content和role。数据集被分为train、val和test三个部分,每个部分都有相应的字节数和示例数。

The dataset includes configurations for English, French, and Italian languages. Each configuration contains features such as id, images, and conversation. The images feature includes bytes and path, while the conversation feature includes content and role. The dataset is divided into train, val, and test splits, each with corresponding byte sizes and example counts.
提供机构:
francepfl
原始信息汇总

数据集概述

配置信息

英语配置

  • 特征:
    • id: 类型为 string
    • images: 包含两个子特征
      • bytes: 类型为 null
      • path: 类型为 string
    • conversation: 包含两个子特征
      • content: 类型为 string
      • role: 类型为 string
  • 分割:
    • train: 704316 字节, 1126 个样本
    • val: 125448 字节, 200 个样本
    • test: 125855 字节, 200 个样本
  • 下载大小: 397374 字节
  • 数据集大小: 955619 字节

法语配置

  • 特征:
    • id: 类型为 string
    • images: 包含两个子特征
      • bytes: 类型为 null
      • path: 类型为 string
    • conversation: 包含两个子特征
      • content: 类型为 string
      • role: 类型为 string
  • 分割:
    • train: 1733882 字节, 2607 个样本
    • val: 202728 字节, 320 个样本
    • test: 203213 字节, 320 个样本
  • 下载大小: 773261 字节
  • 数据集大小: 2139823 字节

意大利语配置

  • 特征:
    • id: 类型为 string
    • images: 包含两个子特征
      • bytes: 类型为 null
      • path: 类型为 string
    • conversation: 包含两个子特征
      • content: 类型为 string
      • role: 类型为 string
  • 分割:
    • train: 3543162 字节, 6325 个样本
    • val: 135406 字节, 240 个样本
    • test: 137663 字节, 240 个样本
  • 下载大小: 1177206 字节
  • 数据集大小: 3816231 字节

数据文件路径

英语配置

  • train: english/train-*
  • val: english/val-*
  • test: english/test-*

法语配置

  • train: french/train-*
  • val: french/val-*
  • test: french/test-*

意大利语配置

  • train: italian/train-*
  • val: italian/val-*
  • test: italian/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作