recmeapp/thumbs-up
收藏Hugging Face2023-03-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/recmeapp/thumbs-up
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自Google Play的210多万条负面用户评论(评分为1或2的评论),涵盖9775个应用和48个类别。此外,每条评论在一个月内收到的投票数也被记录,投票数多的评论被认为是重要评论。
该数据集包含来自Google Play的210多万条负面用户评论(评分为1或2的评论),涵盖9775个应用和48个类别。此外,每条评论在一个月内收到的投票数也被记录,投票数多的评论被认为是重要评论。
提供机构:
recmeapp
原始信息汇总
数据集卡片 for Dataset Name
数据集描述
数据集概述
该数据集包含超过210万条负面用户评论(评分1或2的评论),来自Google Play上的9775个应用,涵盖48个类别。此外,还记录了每条评论在一个月内获得的投票数,投票数较多的评论可被视为重要评论。
支持的任务和排行榜
通过识别突出的应用评论,主动检测应用问题。
语言
英语
如何使用数据集?
python from datasets import load_dataset import pandas as pd
加载数据集
dataset = load_dataset("recmeapp/thumbs-up")
转换为Pandas DataFrame
dfs = {split: dset.to_pandas() for split, dset in dataset.items()} dataset_df = pd.concat([dfs["train"], dfs["validation"], dfs["test"]])
数据集中有多少行?
print(f数据集中有 {len(dataset_df)} 行。)
数据集中有多少个唯一应用?
print(f数据集中有 {len(dataset_df["app_name"].unique())} 个唯一应用。)
数据集中有多少个类别?
print(f数据集中有 {len(dataset_df["category"].unique())} 个唯一类别。)
数据集中一条评论获得的最高投票数是多少?
print(f数据集中一条评论获得的最高投票数是 {max(dataset_df["votes"])}。)



