mathigatti/spanish_imdb_synopsis
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mathigatti/spanish_imdb_synopsis
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自IMDb的4969条西班牙语电影简介。数据字段包括描述(应为西班牙语)、关键词(西班牙语和英语混合)、类型(西班牙语和英语混合)、年份、名称(西班牙语和英语混合)和导演(可能为空)。数据集的创建过程涉及从一个Kaggle数据集开始,然后通过IMDb抓取电影简介,并筛选出有超过5000票/评论且提供西班牙语简介的电影。
提供机构:
mathigatti
原始信息汇总
西班牙IMDb电影简介数据集概述
数据集描述
数据集总结
- 包含4969部电影的西班牙语简介。
支持的任务和排行榜
- 任务类别:摘要生成、文本生成、文本到文本生成。
语言
- 所有描述均为西班牙语,其他字段包含西班牙语和英语混合。
数据集结构
数据字段
description: 电影的IMDb描述(字符串),应为西班牙语。keywords: 电影的IMDb关键词(字符串),西班牙语和英语混合。genre: 电影的类型(字符串),西班牙语和英语混合。year: 电影发布年份(浮点数)。name: 电影名称(字符串),西班牙语和英语混合。director: 电影主要导演名称(字符串),可能为空。
数据集创建
- 数据集基于Kaggle上的IMDb数据集,通过网络爬虫获取了超过5000票/评论的电影简介,并筛选出西班牙语简介。



