five

Mouwiya/imdb_reviews_with_labels_csv

收藏
Hugging Face2024-04-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Mouwiya/imdb_reviews_with_labels_csv
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集包含IMDb电影评论子集的一步情感分析结果,使用BART-large、DistilBERT-base和RoBERTa-base三种预训练语言模型进行零样本分类,预测电影评论的情感倾向(正面或负面)。数据集存储在名为imdb_reviews_with_labels.csv的CSV文件中,并上传至Hugging Face Hub,便于访问和共享。

本数据集包含IMDb电影评论子集的一步情感分析结果,使用BART-large、DistilBERT-base和RoBERTa-base三种预训练语言模型进行零样本分类,预测电影评论的情感倾向(正面或负面)。数据集存储在名为imdb_reviews_with_labels.csv的CSV文件中,并上传至Hugging Face Hub,便于访问和共享。
提供机构:
Mouwiya
原始信息汇总

数据集概述

数据集信息

  • 特征(Features):

    • text: 文本类型,字符串
    • label: 标签类型,整数64位
    • predicted_sentiment_facebook/bart-large-mnli: 预测情感类型,字符串
    • predicted_sentiment_distilbert-base-uncased: 预测情感类型,字符串
    • predicted_sentiment_roberta-base: 预测情感类型,字符串
  • 数据分割(Splits):

    • train: 训练集,包含1000个样本,总大小1361555字节
  • 数据集大小(Dataset Size): 1361555字节

  • 下载大小(Download Size): 862047字节

数据集描述

本数据集用于执行一次性的情感分析任务,使用了IMDb电影评论数据集的一个子集,并应用了多个语言模型进行预测。目标是在不微调模型的情况下预测电影评论的情感(正面或负面)。使用了三种不同的预训练语言模型进行零样本分类:BART-large、DistilBERT-base和RoBERTa-base。每个模型对100个随机抽样的电影评论生成了预测的情感标签,并将这些信息保存在名为"imdb_reviews_with_labels.csv"的CSV文件中。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作