Sports-1M|体育视频数据集|内容标注数据集
收藏
- Sports-1M数据集首次发表,由Google Research团队发布,包含100万个体育视频,涵盖487个不同的运动类别。
- Sports-1M数据集首次应用于视频分类研究,成为深度学习在视频理解领域的重要基准数据集。
- Sports-1M数据集被广泛用于各种视频分析和机器学习研究,推动了视频内容识别技术的发展。
- 随着深度学习技术的进步,Sports-1M数据集在视频分类和动作识别任务中的应用进一步深化,提升了模型的准确性和效率。
- Sports-1M数据集成为多个国际会议和竞赛的标准数据集,促进了视频分析领域的学术交流和技术创新。
- Sports-1M数据集的影响力持续扩大,被用于训练和验证新一代视频分析模型,推动了视频理解技术的进步。
- Sports-1M数据集在视频分析领域的应用逐渐扩展到实际应用场景,如体育赛事分析和智能监控系统。
mstz/speeddating
Speed dating数据集来自OpenML,主要用于二分类任务,即判断两个人是否会约会。数据集的规模在1K到10K之间,包含多个特征,如性别、年龄、种族、兴趣等。
hugging_face 收录
suno
该数据集包含由人工智能生成的659,788首歌曲的元数据,这些歌曲由suno.com平台生成。数据集是多语言的,主要语言为英语,但也包含日语和其他语言的歌词和标题。每个歌曲的元数据包括唯一标识符、视频和音频URL、封面图像URL、AI模型版本、生成状态、创作者信息等。数据集根据CC0许可证公开,允许任何用途的使用、修改和分发。
huggingface 收录
Amazon电影评论数据集
该数据集包含从1997年8月至2012年10月期间,Amazon用户对253,059种产品的7,911,684条评论。数据集被添加了真实标签,这些标签是通过爬取/抓取Amazon.com获得的,用于分类产品。
github 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
Hang Seng Index
恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。
www.hsi.com.hk 收录