five

Cornell Movie-Dialogs Corpus Dataset

收藏
paperswithcode.com2025-01-22 收录
下载链接:
https://paperswithcode.com/dataset/cornell-movie-dialogs-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
This corpus contains a large metadata-rich collection of fictional conversations extracted from raw movie scripts: 220,579 conversational exchanges between 10,292 pairs of movie characters involves 9,035 characters from 617 movies in total 304,713 utterances movie metadata included: genres release year IMDB rating number of IMDB votes IMDB rating character metadata included: gender (for 3,774 characters) position on movie credits (3,321 characters)

本语料库包含了一大批丰富的元数据,这些数据源自未经修饰的电影剧本中的虚构对话,具体信息如下: - 22万5千7百89次对话交流,涉及10,292对电影角色; - 包含来自617部电影中的9,035个角色; - 总计304万7千13次台词; 电影元数据包括: - 类型 - 上映年份 - IMDb评分 - IMDb投票数 - IMDb评分; 角色元数据包括: - 性别(针对3,774个角色) - 电影信用中的角色位置(针对3,321个角色)
提供机构:
Papers with Code
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作