tclopess/sinopsys_movies_portuguese
收藏Hugging Face2024-03-15 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/tclopess/sinopsys_movies_portuguese
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Sinopses IMDB,主要涉及电影领域,包含电影的标题、剧情简介、类型以及一个布尔值字段is_valid。数据集主要用于文本分类和翻译任务,语言为葡萄牙语。数据集分为训练集和测试集,训练集包含17947个样本,测试集包含3168个样本。数据集的总大小为6537232.0字节,下载大小为4121318字节。
该数据集名为Sinopses IMDB,主要涉及电影领域,包含电影的标题、剧情简介、类型以及一个布尔值字段is_valid。数据集主要用于文本分类和翻译任务,语言为葡萄牙语。数据集分为训练集和测试集,训练集包含17947个样本,测试集包含3168个样本。数据集的总大小为6537232.0字节,下载大小为4121318字节。
提供机构:
tclopess
原始信息汇总
数据集概述
基本信息
- 语言: 葡萄牙语 (pt)
- 大小范围: 10K<n<100K
- 任务类别:
- 文本分类
- 翻译
- 美观名称: Sinopses IMDB
- 标签: 电影
数据集特征
- titulo: 字符串类型
- sinopse: 字符串类型
- generos: 字符串类型
- is_valid: 布尔类型
数据分割
- 训练集:
- 示例数量: 17947
- 字节数: 5556414.999005446
- 测试集:
- 示例数量: 3168
- 字节数: 980817.0009945537
数据集大小
- 下载大小: 4121318字节
- 数据集总大小: 6537232.0字节
配置
- 配置名称: default
- 数据文件路径:
- 训练集: data/train-*
- 测试集: data/test-*



