Huggmachas/Bollywood_dialogues

Name: Huggmachas/Bollywood_dialogues
Creator: Huggmachas
Published: 2024-06-05 06:52:42
License: 暂无描述

Hugging Face2024-06-05 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Huggmachas/Bollywood_dialogues

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: ID dtype: string - name: Movie dtype: string - name: Scene dtype: string - name: Dialogues dtype: string - name: Conversation dtype: string - name: Movie_name dtype: string splits: - name: train num_bytes: 1009140 num_examples: 1811 download_size: 597940 dataset_size: 1009140 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征项： - 字段名：ID，数据类型：字符串 - 字段名：影片（Movie），数据类型：字符串 - 字段名：场景（Scene），数据类型：字符串 - 字段名：对白（Dialogues），数据类型：字符串 - 字段名：会话（Conversation），数据类型：字符串 - 字段名：影片名称（Movie_name），数据类型：字符串数据划分： - 划分名称：训练集（train），字节数：1009140，样本数量：1811 下载大小：597940，数据集总大小：1009140 配置项： - 配置名称：默认配置（default），数据文件： - 对应数据划分：训练集，文件路径：data/train-*

提供机构：

Huggmachas

原始信息汇总

数据集概述

数据集特征

ID: 数据类型为字符串。
Movie: 数据类型为字符串。
Scene: 数据类型为字符串。
Dialogues: 数据类型为字符串。
Conversation: 数据类型为字符串。
Movie_name: 数据类型为字符串。

数据集分割

训练集: 包含1811个样本，总大小为1009140字节。

数据集大小

下载大小: 597940字节。
数据集总大小: 1009140字节。

配置

默认配置: 训练数据文件路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集