Cornell Movie-Dialogs Corpus Dataset
收藏paperswithcode.com2025-01-22 收录
下载链接:
https://paperswithcode.com/dataset/cornell-movie-dialogs-corpus
下载链接
链接失效反馈官方服务:
资源简介:
This corpus contains a large metadata-rich collection of fictional conversations extracted from raw movie scripts:
220,579 conversational exchanges between 10,292 pairs of movie characters
involves 9,035 characters from 617 movies
in total 304,713 utterances
movie metadata included:
genres
release year
IMDB rating
number of IMDB votes
IMDB rating
character metadata included:
gender (for 3,774 characters)
position on movie credits (3,321 characters)
本语料库包含了一大批丰富的元数据,这些数据源自未经修饰的电影剧本中的虚构对话,具体信息如下:
- 22万5千7百89次对话交流,涉及10,292对电影角色;
- 包含来自617部电影中的9,035个角色;
- 总计304万7千13次台词;
电影元数据包括:
- 类型
- 上映年份
- IMDb评分
- IMDb投票数
- IMDb评分;
角色元数据包括:
- 性别(针对3,774个角色)
- 电影信用中的角色位置(针对3,321个角色)
提供机构:
Papers with Code



