severo/trending-repos
收藏Hugging Face2024-05-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/severo/trending-repos
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含Hugging Face上每日每种类型(模型、数据集和空间)的前20个趋势仓库。每种类型都可以从其自己的数据集配置中加载。数据集每天更新,包含日期、作者、仓库ID、排名、最近点赞数、总点赞数和月下载数等字段。数据集通过一个cron作业每天更新,调用Hugging Face的API端点获取数据,并使用huggingface.js库上传文件。数据集仅包含公共仓库,反映了Hugging Face用户在过去一周内的点赞行为。
该数据集包含Hugging Face上每日每种类型(模型、数据集和空间)的前20个趋势仓库。每种类型都可以从其自己的数据集配置中加载。数据集每天更新,包含日期、作者、仓库ID、排名、最近点赞数、总点赞数和月下载数等字段。数据集通过一个cron作业每天更新,调用Hugging Face的API端点获取数据,并使用huggingface.js库上传文件。数据集仅包含公共仓库,反映了Hugging Face用户在过去一周内的点赞行为。
提供机构:
severo
原始信息汇总
数据集概述
数据集描述
- 数据集名称: Trending repositories on Hugging Face
- 数据集概要: 该数据集包含每天Hugging Face上每种类型的20个趋势仓库(模型、数据集、空间)。每种类型可通过其各自的配置加载。
数据集结构
数据实例
- 模型: Hugging Face上趋势模型的历史记录
- 数据集: Hugging Face上趋势数据集的历史记录
- 空间: Hugging Face上趋势空间的历史记录
数据字段
- 日期(字符串): 查找趋势仓库的日期
- 作者(字符串): 仓库所有者的ID,可能为空
- ID(字符串): 仓库的ID
- 排名(整数): 在其类型(模型、数据集、空间)中的趋势排名,从1开始
- 最近喜欢数(整数): 最近一周收到的喜欢数
- 总喜欢数(整数): 总喜欢数
- 月下载量(整数): 上个月的下载量,对于空间可能为空
数据分割
- 训练集: 每个配置只有一个分割,包含所有行
数据集创建
数据收集和更新
- 更新频率: 每日
- 数据来源: 通过调用
https://huggingface.co/api/trending?type=${repoType}&limit=20端点获取每种仓库类型的趋势数据 - 数据上传: 使用huggingface.js库上传文件
使用数据集的考虑
数据集偏见
- 偏见来源: 趋势仓库反映的是Hugging Face用户在过去一周内给出的喜欢数,任何用户群体的偏见都可能反映在该数据集中。
- 潜在问题: 作为虚荣指标,一些用户可能会尝试生成假喜欢。



