[SAMPLE] wetter.com data | 20 Years of Historical Weather Data for Major European Cities | Wind ...
收藏CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Global Burden of Disease (GBD) Study
全球疾病负担研究(GBD)是一个综合性的全球健康评估项目,旨在量化全球、国家和地方层面的疾病、伤害和风险因素的负担。数据集包括各种健康指标,如死亡率、发病率、残疾调整生命年(DALYs)等,涵盖了多种疾病和伤害,以及多种风险因素。
ghdx.healthdata.org 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
R dataframes of annotated behaviour data and accelerometer data
Annotated data (anno_data.RDATA) is a dataframe containing scored behaviours per second for individual cats. Accelerometer data (accel_data_RDATA) is a dataframe that contains feature engineered accelerometer data in 1 second epochs.
Mendeley Data 收录
RecFlow
RecFlow是由中国科学技术大学和快手公司联合创建的工业级全流程推荐系统数据集,旨在弥合离线推荐系统基准与真实在线环境之间的差距。该数据集包含3800万次用户交互和19亿次阶段样本,涵盖了从曝光空间到未曝光项目的多阶段推荐流程。数据集的创建过程包括从42,000名用户中收集的在线请求日志,记录了每个推荐请求的详细信息。RecFlow的应用领域广泛,支持多任务推荐、用户行为建模、选择偏差估计等研究,旨在提升推荐系统的整体性能和效果。
arXiv 收录