Milkyway-islander/AI_Human_generated_movie_reviews
收藏Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Milkyway-islander/AI_Human_generated_movie_reviews
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为AI_Human_generated_movie_reviews,包含了5.23k条AI生成的电影评论和5.23k条来自斯坦福IMDB数据集的人类撰写的电影评论。AI评论是通过OpenAI API使用多个模型生成的,包括Gemini 1.5 Pro、GPT-3.5-Turbo和GPT-4.0-Turbo-Preview。在生成过程中应用了质量控制措施,排除了平均单词长度低于215或超过345的评论。数据集的结构包括3列和10460行,主要用于文本分类任务。
The dataset is named AI_Human_generated_movie_reviews. It contains 5.23k AI-generated movie reviews and 5.23k human-written movie reviews sourced from the Stanford IMDB dataset. The AI-generated reviews were created via the OpenAI API using multiple models including Gemini 1.5 Pro, GPT-3.5-Turbo, and GPT-4.0-Turbo-Preview. Quality control measures were applied during the generation process, excluding reviews with an average word length below 215 or exceeding 345. The dataset has 10,460 rows and 3 columns, and is primarily used for text classification tasks.
提供机构:
Milkyway-islander
原始信息汇总
数据集概述
数据集名称
"AI_Human_generated_movie_reviews"
数据集描述
该数据集包含5.23k AI生成的电影评论和5.23k人类撰写的评论,源自斯坦福IMDB数据集。AI评论由多个模型生成,包括Gemini 1.5 Pro, GPT-3.5-Turbo, 和 GPT-4.0-Turbo-Preview,通过OpenAI API实现。生成过程中实施了质量控制,每个会话产生3-5篇评论,每个评论有20至100个会话。平均字长少于215或多于345的评论被排除在外。
数据集特征
- text: 字符串类型
- labels: 整数类型 (int64)
- models: 字符串类型
- index_level_0: 整数类型 (int64)
数据集结构
- 数据集包含3列和10460行。
语言
- 英语 (en)
任务类别
- 文本分类 (text-classification)
大小类别
- 10K<n<100K
数据集分割
- train: 10460个样本,数据集大小为15157689字节。
下载大小
- 8750952字节



