BigQuery Public Datasets|公共数据集数据集|数据分析数据集
收藏
- Google首次推出BigQuery服务,作为其云平台的一部分,旨在提供大规模数据集的快速分析能力。
- BigQuery Public Datasets项目启动,Google开始提供一系列公开数据集,供研究人员和开发者免费使用。
- BigQuery Public Datasets的规模和种类显著增加,涵盖了多个领域,如气候、金融、交通等。
- Google宣布BigQuery支持实时数据分析,进一步提升了其在大数据处理领域的竞争力。
- BigQuery Public Datasets继续扩展,增加了更多高质量的数据集,支持更广泛的研究和应用场景。
- 1BigQuery Public Datasets: A Treasure Trove for Data ScientistsGoogle AI · 2018年
- 2Exploring BigQuery Public Datasets for COVID-19 ResearchGoogle Cloud · 2020年
- 3BigQuery Public Datasets: A Comprehensive Analysis of Usage and ImpactStanford University · 2021年
- 4Leveraging BigQuery Public Datasets for Financial Market AnalysisUniversity of Chicago · 2022年
- 5BigQuery Public Datasets: A Review of Recent Advances and Future DirectionsMassachusetts Institute of Technology · 2023年
stanford_cars
该数据集是一个包含多个汽车品牌和型号的图片数据集,每个图片样本都标记有相应的汽车品牌和型号信息。数据集适用于图像识别和分类任务,特别是汽车品牌和型号的识别。
huggingface 收录
Paper III (Walker et al. 2024)
Data products used in 3-D CMZ Paper III, Walker et al. (2024). The full cloud catalogue is provided in tabular format, along with a full CMZ map showing the clouds and their assigned IDs. For each cloud ID in the published catalogue there are: - Individual cube cutouts from the MOPRA 3mm CMZ survey (HC3N, HCN, and HNCO). - Individual cube cutouts from the APEX 1mm CMZ survey (13CO, C18O, and H2CO). - Cloud-averaged spectra of the ATCA H2CO 4.83 GHz line. - PV slices of the ATCA H2CO 4.83 GHz line, taken across the major axis of the source. - Where applicable, there are mask files which correspond to the different velocity components of the cloud. In these cases, there are two mask files per velocity component, corresponding to the different masking approaches described in the paper.
DataCite Commons 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
