five

recmeapp/thumbs-up

收藏
Hugging Face2023-03-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/recmeapp/thumbs-up
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自Google Play的210多万条负面用户评论(评分为1或2的评论),涵盖9775个应用和48个类别。此外,每条评论在一个月内收到的投票数也被记录,投票数多的评论被认为是重要评论。

该数据集包含来自Google Play的210多万条负面用户评论(评分为1或2的评论),涵盖9775个应用和48个类别。此外,每条评论在一个月内收到的投票数也被记录,投票数多的评论被认为是重要评论。
提供机构:
recmeapp
原始信息汇总

数据集卡片 for Dataset Name

数据集描述

数据集概述

该数据集包含超过210万条负面用户评论(评分1或2的评论),来自Google Play上的9775个应用,涵盖48个类别。此外,还记录了每条评论在一个月内获得的投票数,投票数较多的评论可被视为重要评论。

支持的任务和排行榜

通过识别突出的应用评论,主动检测应用问题。

语言

英语

如何使用数据集?

python from datasets import load_dataset import pandas as pd

加载数据集

dataset = load_dataset("recmeapp/thumbs-up")

转换为Pandas DataFrame

dfs = {split: dset.to_pandas() for split, dset in dataset.items()} dataset_df = pd.concat([dfs["train"], dfs["validation"], dfs["test"]])

数据集中有多少行?

print(f数据集中有 {len(dataset_df)} 行。)

数据集中有多少个唯一应用?

print(f数据集中有 {len(dataset_df["app_name"].unique())} 个唯一应用。)

数据集中有多少个类别?

print(f数据集中有 {len(dataset_df["category"].unique())} 个唯一类别。)

数据集中一条评论获得的最高投票数是多少?

print(f数据集中一条评论获得的最高投票数是 {max(dataset_df["votes"])}。)

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作