mirfan899/imdb_urdu_reviews
收藏Hugging Face2024-07-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/mirfan899/imdb_urdu_reviews
下载链接
链接失效反馈官方服务:
资源简介:
ImDB Urdu Reviews数据集是一个用于文本分类任务的数据集,特别是情感分类。数据集包含从电影评论翻译成乌尔都语的句子,每个句子都有一个情感标签,表示评论的情感是积极的或消极的。数据集的结构包括句子和情感两个字段,但缺少关于数据分割的详细信息。数据集的创建过程、注释过程和注释者的信息未提供。
The ImDB Urdu Reviews dataset is a dataset for text classification tasks, specifically sentiment classification. The dataset contains sentences translated into Urdu from movie reviews, with each sentence having a sentiment label indicating whether the review is positive or negative. The dataset structure includes two fields: sentence and sentiment, but lacks detailed information on data splits. Information on the dataset creation process, annotation process, and annotators is not provided.
提供机构:
mirfan899
原始信息汇总
数据集概述
基本信息
- 数据集名称: ImDB Urdu Reviews
- 语言: 乌尔都语 (ur)
- 许可证: 开放数据库许可证 (odbl)
- 多语言性: 单语种
- 大小类别: 10K<n<100K
- 源数据集: 原始数据
- 任务类别: 文本分类
- 任务ID: 情感分类
数据集结构
- 特征:
- sentence: 字符串类型,包含翻译成乌尔都语的电影评论。
- sentiment: 分类标签类型,包含0(正面)和1(负面)两种情感。
- 数据分割:
- train: 包含50000个样本,总字节数为114670811。
- 下载大小: 31510992字节
- 数据集大小: 114670811字节
数据集创建
- 语言创建者: 机器生成
- 注释创建者: 发现



