agu18dec/movies_dataset_simulate_human_dialogue
收藏Hugging Face2026-04-07 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/agu18dec/movies_dataset_simulate_human_dialogue
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: title
dtype: string
- name: category
dtype: string
- name: show_name
dtype: string
- name: year
dtype: string
- name: genres
sequence: string
- name: writers
sequence: string
- name: script_date
dtype: string
- name: dialog
list:
- name: type
dtype: string
- name: character
dtype: string
- name: text
dtype: string
- name: num_turns
dtype: int64
splits:
- name: train
num_bytes: 194384526
num_examples: 1689
- name: validation
num_bytes: 17068115
num_examples: 113
download_size: 110694658
dataset_size: 211452641
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
数据集信息:
特征字段:
- 字段名:title(作品标题),数据类型:字符串
- 字段名:category(作品类别),数据类型:字符串
- 字段名:show_name(节目名称),数据类型:字符串
- 字段名:year(创作年份),数据类型:字符串
- 字段名:genres(作品流派),数据类型:字符串序列
- 字段名:writers(编剧阵容),数据类型:字符串序列
- 字段名:script_date(剧本创作日期),数据类型:字符串
- 字段名:dialog(对话内容),数据类型:列表类型,包含以下子字段:
- 子字段名:type(对话类型),数据类型:字符串
- 子字段名:character(角色名称),数据类型:字符串
- 子字段名:text(台词文本),数据类型:字符串
- 字段名:num_turns(对话总轮次),数据类型:64位整型
数据集划分:
- 划分名称:train(训练集),数据字节数:194384526,样本数量:1689
- 划分名称:validation(验证集),数据字节数:17068115,样本数量:113
下载总大小:110694658 字节
数据集总大小:211452641 字节
数据集配置:
- 配置名称:default(默认配置),数据文件映射:
- 划分:train(训练集),对应数据路径:data/train-*
- 划分:validation(验证集),对应数据路径:data/validation-*
提供机构:
agu18dec



