five

severo/trending-repos

收藏
Hugging Face2024-05-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/severo/trending-repos
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含Hugging Face上每日每种类型(模型、数据集和空间)的前20个趋势仓库。每种类型都可以从其自己的数据集配置中加载。数据集每天更新,包含日期、作者、仓库ID、排名、最近点赞数、总点赞数和月下载数等字段。数据集通过一个cron作业每天更新,调用Hugging Face的API端点获取数据,并使用huggingface.js库上传文件。数据集仅包含公共仓库,反映了Hugging Face用户在过去一周内的点赞行为。

该数据集包含Hugging Face上每日每种类型(模型、数据集和空间)的前20个趋势仓库。每种类型都可以从其自己的数据集配置中加载。数据集每天更新,包含日期、作者、仓库ID、排名、最近点赞数、总点赞数和月下载数等字段。数据集通过一个cron作业每天更新,调用Hugging Face的API端点获取数据,并使用huggingface.js库上传文件。数据集仅包含公共仓库,反映了Hugging Face用户在过去一周内的点赞行为。
提供机构:
severo
原始信息汇总

数据集概述

数据集描述

  • 数据集名称: Trending repositories on Hugging Face
  • 数据集概要: 该数据集包含每天Hugging Face上每种类型的20个趋势仓库(模型、数据集、空间)。每种类型可通过其各自的配置加载。

数据集结构

数据实例

  • 模型: Hugging Face上趋势模型的历史记录
  • 数据集: Hugging Face上趋势数据集的历史记录
  • 空间: Hugging Face上趋势空间的历史记录

数据字段

  • 日期(字符串): 查找趋势仓库的日期
  • 作者(字符串): 仓库所有者的ID,可能为空
  • ID(字符串): 仓库的ID
  • 排名(整数): 在其类型(模型、数据集、空间)中的趋势排名,从1开始
  • 最近喜欢数(整数): 最近一周收到的喜欢数
  • 总喜欢数(整数): 总喜欢数
  • 月下载量(整数): 上个月的下载量,对于空间可能为空

数据分割

  • 训练集: 每个配置只有一个分割,包含所有行

数据集创建

数据收集和更新

  • 更新频率: 每日
  • 数据来源: 通过调用https://huggingface.co/api/trending?type=${repoType}&limit=20端点获取每种仓库类型的趋势数据
  • 数据上传: 使用huggingface.js库上传文件

使用数据集的考虑

数据集偏见

  • 偏见来源: 趋势仓库反映的是Hugging Face用户在过去一周内给出的喜欢数,任何用户群体的偏见都可能反映在该数据集中。
  • 潜在问题: 作为虚荣指标,一些用户可能会尝试生成假喜欢。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作