five

mathigatti/spanish_imdb_synopsis

收藏
Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mathigatti/spanish_imdb_synopsis
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自IMDb的4969条西班牙语电影简介。数据字段包括描述(应为西班牙语)、关键词(西班牙语和英语混合)、类型(西班牙语和英语混合)、年份、名称(西班牙语和英语混合)和导演(可能为空)。数据集的创建过程涉及从一个Kaggle数据集开始,然后通过IMDb抓取电影简介,并筛选出有超过5000票/评论且提供西班牙语简介的电影。
提供机构:
mathigatti
原始信息汇总

西班牙IMDb电影简介数据集概述

数据集描述

数据集总结

  • 包含4969部电影的西班牙语简介。

支持的任务和排行榜

  • 任务类别:摘要生成、文本生成、文本到文本生成。

语言

  • 所有描述均为西班牙语,其他字段包含西班牙语和英语混合。

数据集结构

数据字段

  • description: 电影的IMDb描述(字符串),应为西班牙语。
  • keywords: 电影的IMDb关键词(字符串),西班牙语和英语混合。
  • genre: 电影的类型(字符串),西班牙语和英语混合。
  • year: 电影发布年份(浮点数)。
  • name: 电影名称(字符串),西班牙语和英语混合。
  • director: 电影主要导演名称(字符串),可能为空。

数据集创建

  • 数据集基于Kaggle上的IMDb数据集,通过网络爬虫获取了超过5000票/评论的电影简介,并筛选出西班牙语简介。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作