Movie Dialog Corpus(电影对话语料库)
收藏阿里云天池2026-06-08 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/88893
下载链接
链接失效反馈官方服务:
资源简介:
A metadata-rich collection of fictional conversations from raw movie scripts.
来自原始电影脚本的虚构对话的元数据丰富的集合
源自原始电影剧本的富含元数据的虚构对话集合
提供机构:
阿里云天池
创建时间:
2021-01-21
搜集汇总
数据集介绍

背景与挑战
背景概述
Movie Dialog Corpus是一个从617部电影原始脚本中提取的大规模虚构对话数据集,包含超过30万个话语和22万次对话交流,涉及9千多个角色。该数据集以丰富的元数据为特点,包括电影体裁、发行年份、IMDB评分以及角色性别和学分排名,适用于自然语言处理、对话生成和电影内容分析等研究。
以上内容由遇见数据集搜集并总结生成



