pa-shk/tmdb_processed
收藏Hugging Face2024-03-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pa-shk/tmdb_processed
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: name
dtype: string
- name: metadata
struct:
- name: adult
dtype: bool
- name: budget
dtype: int64
- name: genres
dtype: string
- name: imdb_id
dtype: string
- name: original_language
dtype: string
- name: original_title
dtype: string
- name: overview
dtype: string
- name: popularity
dtype: float64
- name: production_companies
dtype: string
- name: production_countries
dtype: string
- name: release_date
dtype: string
- name: revenue
dtype: int64
- name: runtime
dtype: int64
- name: spoken_languages
dtype: string
- name: status
dtype: string
- name: tagline
dtype: string
- name: vote_average
dtype: float64
- name: vote_count
dtype: int64
- name: id
dtype: string
- name: embed
sequence: float32
splits:
- name: train
num_bytes: 23949369
num_examples: 6629
download_size: 26213085
dataset_size: 23949369
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
pa-shk
原始信息汇总
数据集信息
特征
- name: 类型为字符串。
- metadata: 结构化数据,包含以下字段:
- adult: 布尔类型。
- budget: 64位整数类型。
- genres: 字符串类型。
- imdb_id: 字符串类型。
- original_language: 字符串类型。
- original_title: 字符串类型。
- overview: 字符串类型。
- popularity: 64位浮点数类型。
- production_companies: 字符串类型。
- production_countries: 字符串类型。
- release_date: 字符串类型。
- revenue: 64位整数类型。
- runtime: 64位整数类型。
- spoken_languages: 字符串类型。
- status: 字符串类型。
- tagline: 字符串类型。
- vote_average: 64位浮点数类型。
- vote_count: 64位整数类型。
- id: 字符串类型。
- embed: 32位浮点数序列。
数据分割
- train: 包含6629个样本,占用23949369字节。
数据集大小
- 下载大小: 26213085字节。
- 数据集大小: 23949369字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。



