Cambridge Bay Camera Lights Deployed 2014-09-26
收藏MNBVC
MNBVC数据集是一个超大规模的中文语料集,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。
github 收录
市规划和自然资源局-深圳市建设项目用地批准信息(划拨)
市规划和自然资源局-深圳市建设项目用地批准信息(划拨)
深圳市政府数据开放平台 收录
AirSafe_DB
该数据集包含了从Plane Crash Info网站上抓取的飞机事故的结构化信息,原始数据为CSV格式,经过AI模型处理后生成了标准化的JSON格式数据。数据集包含5049条记录,每条记录包括事故信息(日期、时间、地点等)、飞机信息(运营商、航班号、机型等)、伤亡统计(总死亡人数、机组人员、乘客、地面人员等)、事故摘要(事故描述、事故类型、飞行阶段等)等内容。数据经过标准化处理,确保数据质量和一致性,适用于分析和研究。
huggingface 收录
Nikkei 225
Nikkei 225,又称日经225指数,是日本东京证券交易所的一个重要股票市场指数,由225家日本大型上市公司组成。该指数是衡量日本股市表现的重要指标,涵盖了从制造业到服务业的多个行业。
indexes.nikkei.co.jp 收录
Electrical-Lines-Defect-Detection
该数据集是针对电力线路缺陷检测的,包含了由APEPDCL线路工人使用移动相机捕获的图片,并由Sampath Balaji团队整理。数据集以CC BY 4.0许可证发布,旨在促进开源合作、可重现性和人工智能的实践学习。数据集分为两个模块:目标检测和分类。目标检测模块遵循YOLOv12格式,分类模块由文件夹和CSV文件组成,都提供了训练、验证和测试数据集。
huggingface 收录
