five

Cornell Natural Language Visual Reasoning Dataset

收藏
github2023-10-01 更新2024-05-31 收录
下载链接:
https://github.com/datmo/open-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
康奈尔自然语言视觉推理数据集,用于自然语言和视觉推理的研究。

The Cornell Natural Language Visual Reasoning Dataset is utilized for research in natural language and visual reasoning.
创建时间:
2017-04-25
原始信息汇总

数据集概述

通用数据集

  • Cornell Natural Language Visual Reasoning Dataset
    类型:单个
    访问:免费

  • Structured Wikipedia Data
    类型:集合
    访问:免费
    许可证:GNU License

  • UCI Machine Learning Repository
    类型:集合
    访问:免费

  • Socrata Open Datasets
    类型:集合
    访问:免费

  • Datasets for Data Mining and Data Science
    类型:集合
    访问:免费

  • List of datasets for machine learning research
    类型:集合
    访问:免费

  • Lexical Database for English
    类型:单个
    访问:免费

  • Wolfram Data Repository
    类型:集合
    访问:免费

农业数据集

  • U.S. Department of Agricultures PLANTS Database
    类型:单个
    访问:免费

  • U.S. Department of Agricultures Nutrient Database
    类型:集合
    访问:免费

生物学数据集

  • 1000 Genomes
    类型:集合
    访问:免费

  • American Gut (Microbiome Project)
    类型:集合
    访问:免费

  • Broad Bioimage Benchmark Collection (BBBC)
    类型:集合
    访问:免费

  • Broad Cancer Cell Line Encyclopedia (CCLE)
    类型:集合
    访问:需登录

  • Cell Image Library
    类型:集合
    访问:免费

  • Complete Genomics Public Data
    类型:集合
    访问:免费

  • EBI ArrayExpress
    类型:集合
    访问:免费

  • EBI Protein Data Bank in Europe
    类型:集合
    访问:免费

  • Electron Microscopy Pilot Image Archive (EMPIAR)
    类型:集合
    访问:免费

  • ENCODE project
    类型:集合
    访问:免费

  • Ensembl Genomes
    类型:集合
    访问:免费

  • Gene Expression Omnibus (GEO)
    类型:集合
    访问:免费

  • Gene Ontology (GO)
    类型:集合
    访问:免费

  • Global Biotic Interactions (GloBI)
    类型:单个
    访问:免费

  • Harvard Medical School (HMS) LINCS Project
    类型:集合
    访问:免费

  • Human Genome Diversity Project
    类型:单个
    访问:免费

  • Human Microbiome Project (HMP)
    类型:集合
    访问:免费

  • ICOS PSP Benchmark
    类型:集合
    访问:免费

  • International HapMap Project
    类型:单个
    访问:免费

  • Journal of Cell Biology DataViewer
    类型:集合
    访问:免费

  • MIT Cancer Genomics Data
    类型:集合
    访问:免费

  • NCBI Proteins
    类型:集合
    访问:需登录

  • NCBI Taxonomy
    类型:单个
    访问:需登录

  • NCI Genomic Data Commons
    类型:集合
    访问:免费

  • NIH Microarray data
    类型:集合
    访问:免费

  • OpenSNP genotypes data
    类型:集合
    访问:需登录

  • Pathguid - Protein-Protein Interactions Catalog
    类型:集合
    访问:免费

  • Protein Data Bank
    类型:集合
    访问:需登录

  • Psychiatric Genomics Consortium
    类型:集合
    访问:需登录

  • PubChem Project
    类型:集合
    访问:免费

  • PubGene (now Coremine Medical)
    类型:集合
    访问:需登录

  • Sanger Catalogue of Somatic Mutations in Cancer (COSMIC)
    类型:集合
    访问:需登录

  • Sanger Genomics of Drug Sensitivity in Cancer Project (GDSC)
    类型:集合
    访问:免费

  • Sequence Read Archive(SRA)
    类型:集合
    访问:免费

  • Stowers Institute Original Data Repository
    类型:集合
    访问:免费

  • Systems Science of Biological Dynamics (SSBD) Database
    类型:集合
    访问:免费

  • The Cancer Genome Atlas (TCGA), available via Broad GDAC
    类型:集合
    访问:免费

  • The Catalogue of Life
    类型:集合
    访问:免费

  • The Personal Genome Project
    类型:集合
    访问:需登录

  • UCSC Public Data
    类型:集合
    访问:免费

  • UniGene
    类型:集合
    访问:需登录

  • Universal Protein Resource (UnitProt)
    类型:集合
    访问:免费

气候/天气数据集

  • Actuaries Climate Index
    类型:单个
    访问:需登录

  • Australian Weather
    类型:集合
    访问:免费

  • Aviation Weather Center - Consistent, timely and accurate weather information for the world airspace system
    类型:集合
    访问:需登录

  • Brazilian Weather - Historical data (In Portuguese)
    类型:集合
    访问:需登录

  • Canadian Meteorological Centre
    类型:集合
    访问:免费

  • Climate Data from UEA (updated monthly)
    类型:集合
    访问:免费

  • European Climate Assessment & Dataset
    类型:集合
    访问:免费

  • Global Climate Data Since 1929
    类型:集合
    访问:免费

  • NASA Global Imagery Browse Services
    类型:集合
    访问:需登录

  • NOAA Bering Sea Climate
    类型:集合
    访问:免费

  • NOAA Climate Datasets
    类型:集合
    访问:免费

  • NOAA Realtime Weather Models
    类型:集合
    访问:免费

  • NOAA SURFRAD Meteorology and Radiation Datasets
    类型:集合
    访问:免费

  • The World Bank Open Data Resources for Climate Change
    类型:集合
    访问:免费

  • WorldClim - Global Climate Data
    类型:单个
    访问:免费

  • WU Historical Weather Worldwide
    类型:集合
    访问:需登录

复杂网络数据集

  • AMiner Citation Network Dataset
    类型:单个
    访问:免费

  • CrossRef DOI URLs
    类型:单个
    访问:需登录

  • DBLP Citation dataset
    类型:单个
    访问:需登录

  • DIMACS Road Networks Collection
    类型:集合
    访问:免费

  • NBER Patent Citations
    类型:集合
    访问:免费

  • Network Repository with Interactive Exploratory Analysis Tools
    类型:集合
    访问:需登录

  • NIST complex networks data collection
    类型:集合
    访问:免费

  • Protein-protein interaction network
    类型:集合
    访问:免费

  • PyPI and Maven Dependency Network
    类型:集合
    访问:免费

  • Scopus Citation Database
    类型:单个
    访问:付费

  • Small Network Data
    类型:集合
    访问:免费

  • Stanford GraphBase (Steven Skiena)
    类型:集合
    访问:免费

  • Stanford Large Network Dataset Collection
    类型:集合
    访问:免费

  • Stanford Longitudinal Network Data Sources
    类型:集合
    访问:免费

  • The Koblenz Network Collection
    类型:集合
    访问:免费

  • The Laboratory for Web Algorithmics (UNIMI)
    类型:集合
    访问:免费

  • UCI Network Data Repository
    类型:集合
    访问:免费

  • UFL sparse matrix collection
    类型:集合
    访问:免费

  • WSU Graph Database
    类型:集合
    访问:免费

计算机网络数据集

  • 3.5B Web Pages from CommonCrawl 2012
    类型:集合
    访问:需登录

  • 53.5B Web clicks of 100K users in Indiana Univ.
    类型:单个
    访问:需登录

  • CAIDA Internet Datasets
    类型:集合
    访问:免费

  • ClueWeb09 - 1B web pages
    类型:单个
    访问:需登录

  • ClueWeb12 - 733M web pages
    类型:单个
    访问:需登录

  • CommonCrawl Web Data over 7 years
    类型:集合
    访问:付费

  • CRAWDAD Wireless datasets from Dartmouth Univ.
    类型:集合
    访问:需登录

  • Criteo click-through data
    类型:集合
    访问:免费

  • OONI: Open Observatory of Network Interference - Internet censorship data
    类型:集合
    访问:免费

  • Open Mobile Data by MobiPerf
    类型:集合
    访问:付费

  • Rapid7 Sonar Internet Scans
    类型:单个
    访问:免费

  • UCSD Network Telescope, IPv4 /8 net
    类型:集合
    访问:付费

数据挑战数据集

  • Bruteforce Database
    类型:集合
    访问:付费

  • Challenges in Machine Learning
    类型:集合
    访问:免费

  • CrowdANALYTIX dataX
    类型:集合
    访问:需登录

  • D4D Challenge of Orange
    类型:集合
    访问:需登录

  • DrivenData Competitions for Social Good
    类型:集合
    访问:需登录

  • ICWSM Data Challenge (since 2009)
    类型:集合
    访问:需登录

  • Kaggle Competition Data
    类型:集合
    访问:需登录

  • KDD Cup by Tencent 2012
    类型:集合
    访问:需登录

  • Localytics Data Visualization Challenge
    类型:集合
    访问:付费

  • Netflix Prize
    类型:单个
    访问:免费

  • Space Apps Challenge
    类型:单个
    访问:免费

  • Telecom Italia Big Data Challenge
    类型:集合
    访问:需登录

  • TravisTorrent Dataset - MSR2017 Mining Challenge
    类型:集合
    访问:免费

  • Yelp Dataset Challenge
    类型:单个
    访问:需登录

地球科学数据集

  • AQUASTAT - Global water resources and uses
    类型:集合
    访问:免费

  • BODC - marine data of ~22K vars
    类型:集合
    访问:需登录

  • Earth Models
    类型:集合
    访问:需登录

  • EOSDIS - NASAs earth observing system data
    类型:集合
    访问:需登录

  • Integrated Marine Observing System (IMOS) - roughly 30TB of ocean measurements
    类型:集合
    访问:免费

  • Marinexplore - Open Oceanographic Data
    类型:集合
    访问:需登录

  • Smithsonian Institution Global Volcano and Eruption Database
    类型:集合
    访问:免费

  • USGS Earthquake Archives
    类型:集合
    访问:免费

经济学数据集

  • American Economic Association (AEA)
    类型:集合
    访问:需登录

  • EconData from UMD
    类型:集合
    访问:需登录

  • Economic Freedom of the World Data
    类型:集合
    访问:付费

  • Historical MacroEconomic Statistics
    类型:集合
    访问:免费

  • International Economics Database
    类型:集合
    访问:免费

  • International Trade Statistics
    类型:集合
    访问:免费

  • Internet Product Code Database
    类型:集合
    访问:需登录

  • Joint External Debt Data Hub
    类型:集合
    访问:免费

  • Jon Haveman International Trade Data Links
    类型:集合
    访问:免费

  • OpenCorporates Database of Companies in the World
    类型:集合
    访问:需登录

  • Our World in Data
    类型:集合
    访问:免费

  • SciencesPo World Trade Gravity Datasets
    类型:集合
    访问:免费

  • The Atlas of Economic Complexity
    类型:集合
    访问:免费

  • The Center for International Data
    类型:集合
    访问:免费

  • The Observatory of Economic Complexity
    类型:集合
    访问:免费

  • UN Commodity Trade Statistics
    类型:集合
    访问:需登录

  • UN Human Development Reports
    类型:集合
    访问:免费

教育数据集

  • College Scorecard Data
    类型:单个
    访问:免费

  • Student Data from Free Code Camp
    类型:单个
    访问:需登录

能源数据集

  • AMPds
    类型:单个
    访问:免费

  • COMBED
    类型:单个
    访问:免费

  • DRED
    类型:集合
    访问:需登录

  • ECO
    类型:单个
    访问:免费

  • EIA
    类型:集合
    访问:免费

  • HES
    类型:单个
    访问:免费

  • HFED
    类型:集合
    访问:免费

  • iAWE
    类型:单个
    访问:免费

  • PLAID
    类型:单个
    访问:免费

  • REDD
    类型:集合
    访问:免费

  • Tracebase
    类型:集合
    访问:免费

  • UK-DALE
    类型:单个
    访问:免费

  • WHITED
    类型:单个
    访问:免费

金融数据集

  • CBOE Futures Exchange
    类型:集合
    访问:需登录

  • Google Finance
    类型:集合
    访问:需登录

  • Google Trends
    类型:集合
    访问:需登录

  • NASDAQ
    类型:集合
    访问:需登录

  • NYSE Market Data
    类型:集合
    访问:免费

  • OANDA
    类型:集合
    访问:需登录

  • OSU Financial data
    类型:集合
    访问:免费

  • Quandl
    类型:集合
    访问:需登录

  • St Louis Federal
    类型:集合
    访问:需登录

  • Yahoo Finance
    类型:集合
    访问:需登录

GIS数据集

  • ArcGIS Open Data portal
    类型:集合
    访问:需登录

  • Cambridge, MA, US, GIS data on GitHub
    类型:集合
    访问:需登录

  • Factual Global Location Data
    类型:集合
    访问:需登录

  • Geo Spatial Data from ASU
    类型:集合
    访问:需登录

搜集汇总
数据集介绍
main_image_url
构建方式
Cornell Natural Language Visual Reasoning Dataset(Cornell NLVR)是由康奈尔大学自然语言处理实验室构建的,旨在推动自然语言与视觉推理领域的研究。该数据集的构建过程涉及生成大量包含自然语言描述和对应图像对的样本,这些样本经过精心设计,以确保语言描述与图像内容之间存在复杂的推理关系。数据集中的每个样本都经过人工验证,确保其准确性和一致性,从而为研究者提供了一个高质量的基准数据集。
特点
Cornell NLVR数据集的特点在于其独特的自然语言与视觉推理任务设计。数据集中的每个样本包含一个自然语言描述和一组图像,要求模型根据描述判断图像内容是否符合描述的逻辑。这种设计不仅考验模型的语言理解能力,还要求其具备较强的视觉推理能力。此外,数据集涵盖了多种复杂的推理场景,包括空间关系、属性比较和逻辑组合等,为研究者提供了一个多样化的测试平台。
使用方法
Cornell NLVR数据集的使用方法主要围绕自然语言与视觉推理任务的模型训练与评估展开。研究者可以通过下载数据集,利用其中的自然语言描述和图像对进行模型训练。在评估阶段,模型需要根据给定的描述对图像内容进行推理判断,并输出是否符合描述的结论。数据集提供了详细的评估指标和基准结果,方便研究者对比和改进模型性能。此外,数据集还可用于多模态学习、视觉问答等相关领域的研究。
背景与挑战
背景概述
Cornell Natural Language Visual Reasoning Dataset(Cornell NLVR)是由康奈尔大学自然语言处理实验室开发的一个数据集,旨在推动自然语言与视觉推理领域的研究。该数据集创建于2015年,主要研究人员包括康奈尔大学的计算机科学和语言学专家。其核心研究问题在于如何通过自然语言描述来理解和推理复杂的视觉场景。NLVR数据集通过提供大量的图像对和相应的自然语言描述,帮助研究者开发能够理解语言与视觉之间复杂关系的模型。该数据集在自然语言处理、计算机视觉以及多模态学习领域具有重要影响力,推动了诸如视觉问答、图像描述生成等任务的发展。
当前挑战
Cornell NLVR数据集面临的挑战主要体现在两个方面。首先,在领域问题方面,该数据集旨在解决自然语言与视觉推理的复杂交互问题,要求模型不仅能够理解语言描述,还需具备对图像内容的深度推理能力。这种多模态任务的复杂性使得模型的训练和评估极具挑战性,尤其是在处理语义歧义和复杂场景时。其次,在数据集构建过程中,研究人员需要确保图像与语言描述之间的高度一致性,同时避免数据偏差。此外,数据集的规模和质量也直接影响了模型的泛化能力,如何平衡数据多样性与标注准确性是构建过程中的一大难题。
常用场景
经典使用场景
Cornell Natural Language Visual Reasoning Dataset(NLVR)在自然语言处理与计算机视觉交叉领域的研究中占据重要地位。该数据集通过提供丰富的图像与自然语言描述对,支持研究者开发能够理解视觉内容并执行复杂推理任务的模型。经典使用场景包括视觉问答、图像描述生成以及多模态推理任务,这些任务要求模型不仅能够识别图像中的对象,还能理解自然语言描述中的逻辑关系。
衍生相关工作
NLVR数据集催生了一系列经典研究工作,如基于Transformer的多模态模型、视觉推理网络以及跨模态预训练模型。这些工作不仅在学术领域取得了显著成果,还推动了工业界的技术进步。例如,Google的ViLBERT和Facebook的LXMERT等模型均受到NLVR数据集的启发,进一步推动了多模态学习的发展。此外,NLVR还为其他多模态数据集的设计提供了参考,如VQA和GQA等。
数据集最近研究
最新研究方向
Cornell Natural Language Visual Reasoning Dataset(NLVR)作为自然语言处理与计算机视觉交叉领域的重要数据集,近年来在视觉推理任务中展现出显著的研究价值。随着多模态学习技术的快速发展,NLVR数据集被广泛应用于视觉问答、图像描述生成以及跨模态推理等前沿方向。特别是在结合深度学习与符号推理的研究中,NLVR为模型提供了丰富的语义与视觉对齐信息,推动了多模态预训练模型(如CLIP、Flamingo等)的优化与创新。此外,NLVR在解决复杂场景下的逻辑推理问题中表现出色,为智能系统在自动驾驶、医疗影像分析等领域的应用提供了理论支持。其开放性与高质量标注进一步促进了学术界与工业界的合作,成为推动多模态人工智能发展的重要基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作