BBT-FinCorpus|金融NLP数据集|预训练数据集数据集
收藏
- 1BBT-Fin: Comprehensive Construction of Chinese Financial Domain Pre-trained Language Model, Corpus and Benchmark上海数据科学重点实验室 · 2023年
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
公交线路时段客流分析
通过多层次、多维度的数据采集与处理方法获取乘客的上下车时间、地点、乘车刷卡类型等数据,再结合杭州公交线路数据和站点数据,可以为各大地图厂商、商业地产、相关政府单位主体等提供关于杭州市不同线路、不同站点在不同时间段的客流量分析服务,例如杭州市不同公交线路/站点的每日客流汇总、周均值客流、刷卡方式分布数据等,运用图表、地图、热力图、公交客流OD矩阵等直观方式展示分析结果,使复杂数据易于理解,还可根据具体需求,提供不同维度、不同时间跨度的定制化分析结果,满足不同主体的信息需求。
杭州数据交易所 收录