London public transport network|交通网络分析数据集|城市交通数据集
收藏数据集概述
本数据集用于演示如何使用Google Cloud Dataflow将数据从Google BigQuery导入到Neo4j图数据库中。数据集包含伦敦公共交通网络的信息,这些信息代表伦敦的各个车站及其之间的连接。
数据集内容
- 数据来源:Transport for London
- 数据类型:CSV文件
- 数据内容:伦敦公共交通网络的各个车站及其连接关系
- 数据位置:datasets/csv_files/london_transport/
使用场景
本数据集主要用于测试和演示如何通过Google Cloud Dataflow进行数据提取、转换和加载(ETL)到Neo4j图数据库中。通过此数据集,用户可以学习如何配置和部署Dataflow作业,以及如何将BigQuery或Google Cloud Storage中的数据导入Neo4j。
相关教程
通过这些教程,用户可以了解如何准备数据源、配置Dataflow作业模板,并将数据ETL到Neo4j中,最终构建出伦敦交通网络的图数据库。

Obstacle-dataset OD
该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
NASA Battery Dataset
用于预测电池健康状态的数据集,由NASA提供。
github 收录
TEDS
TEDS(Tencent Chinese Corpus)是由腾讯公司发布的中文文本数据集,主要用于自然语言处理和文本分类任务。该数据集包含了大量的中文文本数据,涵盖了新闻、社交媒体、论坛等多种来源,适用于训练和评估中文语言模型和文本分类模型。
ai.tencent.com 收录