Cora|文本分类数据集|自然语言处理数据集
收藏
- Cora数据集首次发表,作为机器学习和数据挖掘领域的基准数据集,用于评估分类算法在图结构数据上的性能。
- Cora数据集首次应用于图神经网络(GNN)的研究中,标志着其在深度学习领域的应用开始。
- Cora数据集在图卷积网络(GCN)的研究中得到广泛应用,成为图神经网络模型性能评估的重要基准。
- Cora数据集被用于验证多种新型图神经网络架构的有效性,进一步巩固了其在图神经网络研究中的地位。
- 1Mining of Massive DatasetsStanford University · 2014年
- 2Semi-Supervised Classification with Graph Convolutional NetworksUniversity of California, Los Angeles · 2017年
- 3DeepWalk: Online Learning of Social RepresentationsUniversity of Pennsylvania · 2014年
- 4Inductive Representation Learning on Large GraphsStanford University · 2017年
- 5Node2Vec: Scalable Feature Learning for NetworksStanford University · 2016年
lmarena-ai/arena-hard-auto-v0.1
--- license: apache-2.0 dataset_info: features: - name: question_id dtype: string - name: category dtype: string - name: cluster dtype: string - name: turns list: - name: content dtype: string splits: - name: train num_bytes: 251691 num_examples: 500 download_size: 154022 dataset_size: 251691 configs: - config_name: default data_files: - split: train path: data/train-* --- ## Arena-Hard-Auto **Arena-Hard-Auto-v0.1** ([See Paper](https://arxiv.org/abs/2406.11939)) is an automatic evaluation tool for instruction-tuned LLMs. It contains 500 challenging user queries sourced from Chatbot Arena. We prompt GPT-4-Turbo as judge to compare the models' responses against a baseline model (default: GPT-4-0314). Notably, Arena-Hard-Auto has the highest *correlation* and *separability* to Chatbot Arena among popular open-ended LLM benchmarks ([See Paper](https://arxiv.org/abs/2406.11939)). If you are curious to see how well your model might perform on Chatbot Arena, we recommend trying Arena-Hard-Auto. Please checkout our GitHub repo on how to evaluate models using Arena-Hard-Auto and more information about the benchmark. If you find this dataset useful, feel free to cite us! ``` @article{li2024crowdsourced, title={From Crowdsourced Data to High-Quality Benchmarks: Arena-Hard and BenchBuilder Pipeline}, author={Li, Tianle and Chiang, Wei-Lin and Frick, Evan and Dunlap, Lisa and Wu, Tianhao and Zhu, Banghua and Gonzalez, Joseph E and Stoica, Ion}, journal={arXiv preprint arXiv:2406.11939}, year={2024} } ```
hugging_face 收录
汶上县政府安排工作退役士兵选岗公示
该目录主要描述汶上县政府安排工作退役士兵选岗公示,包含主管单位、单位所在地、选岗人、接收安置单位、备注、安置计划、单位性质等信息项
山东公共数据开放网 收录
LIGO Open Science Center Data
LIGO Open Science Center Data 包含来自激光干涉引力波天文台(LIGO)的观测数据,主要用于研究引力波的探测和分析。数据集包括引力波事件的原始数据、处理后的数据以及相关的元数据,适用于天文学、物理学和数据科学领域的研究。
www.gw-openscience.org 收录
ReferCOCO数据集
ReferCOCO数据集包括refcoco、refcoco+和refcocog三个子集,用于视觉定位任务。数据集包含图像和对应的描述性文本,用于训练和测试模型识别图像中特定对象的能力。
github 收录
MME-RealWorld
MME-RealWorld是一个精心设计的基准,旨在解决现实世界应用中的实际问题。该数据集包含13,366张高分辨率图像,平均分辨率为2,000 × 1,500像素,涵盖29,429个由25名众包工作者和7名MLLM专家精心制作的注释,涉及43个任务。数据集的主要优势包括:1) 数据规模:由32名志愿者手动注释的29,429个QA对,是目前已知的最大全人工注释基准。2) 数据质量:高分辨率图像和人工完成的注释,确保了数据质量。3) 任务难度和实际应用价值:即使是最高级的模型,准确率也未超过60%,许多现实世界的任务比传统基准更难。4) 中文版本MME-RealWord-CN:针对中文场景收集的图像和注释,解决了英文版本翻译可能存在的问题。
huggingface 收录