Bus Open Data Rasters|公交数据数据集|交通分析数据集
收藏数据集概述
数据集名称
- Bus Open Data Rasters
数据来源
- 数据通过DfT Bus Open Data Service捕获。
数据格式
- 提供的数据为GeoTIFF格式,按不同区域(由经纬度定义的边界框)和每小时时间段的50米空间分辨率。
数据类型
- distinctJourneyCounts(行程计数):指定时间段内每个网格方块中进入的不同公交行程(定义为车辆沿路线单向行驶)的数量。
- averageSpeeds(平均速度,米/秒):每分钟观察一次,链接同一公交行程内的观察,计算连续观察之间的平均速度。每个网格方块的值是所有交叉行程速度的平均值。
数据存储
- 数据以压缩zip格式提供,zip文件名标识数据值、地理区域和日期范围。
数据可用性
- 伦敦:提供多个时间段的平均速度和行程计数数据。
- 东北:提供多个时间段的平均速度和行程计数数据。
时间范围
- 伦敦:数据从2023年10月27日至2024年5月8日。
- 东北:数据从2023年12月17日至2024年5月7日。
边界框定义
- 伦敦:边界框由两组经纬度坐标定义。
- 东北:边界框由两组经纬度坐标定义。
贡献者
- 数据集由Peter Baudains在CUSP London开发。
许可证信息
- 数据根据Open Government License v3.0授权。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
TIMIT
TIMIT 阅读语音语料库的开发旨在为声学语音研究和自动语音识别系统的评估提供语音数据。 TIMIT 包含 630 个人/说话者的 8 种不同美式英语方言的高质量录音,每个人阅读多达 10 个语音丰富的句子。
OpenDataLab 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录