five

hackercupai/hackercup

收藏
Hugging Face2024-12-14 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/hackercupai/hackercup
下载链接
链接失效反馈
官方服务:
资源简介:
Meta Hacker Cup 2011-2023数据集包含了从2011年到2023年Facebook/Meta Hacker Cup的所有问题。每个问题都包括问题陈述、输入文件、输出文件、示例输入、示例输出以及可能的图像和代码解决方案。数据集提供了HTML和Markdown格式的问题陈述,以及一些问题的解决方案和分析。此外,还提供了如何使用该数据集的快速入门指南和引用格式。

This dataset contains every Facebook/Meta Hacker Cup problem from 2011 through 2023. For each problem, youll find these files: problem statement (Markdown format), full input file, full output file (some problems may accept multiple possible outputs), sample input and output files provided by the problem statement. For problems from 2011 through 2019, the problems were initially typeset in HTML, so there are also HTML formatted problem statements. For some problems, written solutions/analyses and code solutions (C++, Python, Java) are available. Some problems contain references to images, which can be found in the same folder as the problem statement. Additionally, starter kits for quick start solutions are provided.
提供机构:
hackercupai
原始信息汇总

Meta Hacker Cup 2011-2023 数据集概述

数据集概览

  • 样本数据集 ("sample"): 包含2023年的数据子集,共10行。
  • 完整数据集: 包含2011年至2023年的数据,文件名为 output_dataset.parquet

字段说明

数据集包含以下字段:

  • name (字符串)
  • year (字符串)
  • round (字符串)
  • statement (字符串)
  • input (字符串)
  • solution (字符串)
  • code (字符串)
  • sample_input (字符串)
  • sample_output (字符串)
  • images (base64图像字符串数组)

文件结构

每个问题包含以下文件:

  • <problem_name>.md: 问题陈述的Markdown格式文件。
  • <problem_name>.in: 完整输入文件。
  • <problem_name>.out: 完整输出文件。
  • <problem_name>_sample_input.txt: 问题陈述提供的样本输入。
  • <problem_name>_sample_output.txt: 问题陈述提供的样本输出。

对于2011年至2019年的问题,还包含以下文件:

  • <problem_name>.html: 问题陈述的HTML格式文件。

部分问题包含以下文件:

  • <problem_name>.sol.md: 问题分析/解决方案的Markdown文件。
  • <problem_name>.(cpp|py|java): 代码解决方案文件。

部分问题包含图像引用,格式为 {{PHOTO_ID:<photo_id>}},对应的图像文件为 <photo_id>.jpg<photo_id>.gif

注意事项

  • 2019年之前的解决方案不包含Markdown格式的解决方案文件。
  • 2019年的Markdown解决方案不包含在数据集中,但可以在 .cpp 文件中找到。

引用

如果使用此数据集,请按以下格式引用: bibtex @misc{2024hackercupai, title = {2024 Hacker Cup Dataset}, author = {May, Wesley and Harmeyer, David and Hoak, Amber and Yang, Weiwei and Saroufim, Mark and Isaacson, Joe and Antiga, Luca and Bowyer, Greg and Guessous, Driss and Puhrsch, Christian and Rao, Supriya and Li, Margaret}, }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建采取了对Facebook/Meta Hacker Cup竞赛自2011年至2023年间所有问题的全面整合。数据集包括问题陈述、输入、输出、解决方案代码以及示例输入输出等。这些问题陈述最初以Markdown或HTML格式存储,其中部分HTML格式的问题陈述已自动转换为Markdown格式,可能存在转换误差。数据集分为样本集和完整集,分别存储为Parquet格式文件,确保了数据的高效存储与访问。
特点
数据集的特点在于其全面性与多样性,涵盖了十二年来Hacker Cup竞赛的所有问题。每个问题均包含详尽的信息,如问题陈述、输入输出示例、解决方案以及代码。特别地,数据集还包含了图像资源引用,并在相应文件夹中提供图片文件。此外,数据集遵循Apache-2.0开源协议,保证了其使用的灵活性。
使用方法
使用该数据集时,用户可根据需求选择样本集或完整集。样本集提供了10行数据的预览,而完整集则包含了全部数据。数据集以Parquet格式存储,便于高效读取。用户可通过HackerCupAI Repo中提供的快速入门解决方案,如Langchain和AutoGen框架,来学习数据处理、解决方案生成与评估的基本步骤。同时,数据集的使用者应遵循引用规范,以利于学术交流和数据集的持续发展。
背景与挑战
背景概述
Meta Hacker Cup数据集,亦称为Hackercup,是由Facebook/Meta公司自2011年起举办的编程竞赛所生成的数据集。该数据集详尽地收录了历年竞赛的问题、输入、输出、解决方案以及代码实现。主要研究人员包括Wesley May、David Harmeyer等,他们通过构建这一数据集,旨在促进编程竞赛问题解决的研究,提升算法能力。数据集自发布以来,对编程竞赛分析、自动解题系统开发等领域产生了深远的影响,成为相关研究的重要资源。
当前挑战
该数据集在研究领域中面临的挑战主要包括:如何有效地从非结构化数据中提取关键信息,以及如何利用这些数据开发出具有普遍适用性的自动解题系统。在构建过程中,数据集的挑战体现在对早期HTML格式的问题描述进行自动化转换至Markdown格式时可能出现的错误,以及如何处理和存储大量的编程问题和解决方案数据。
常用场景
经典使用场景
在计算机算法竞赛领域,Meta Hacker Cup数据集作为一项宝贵的资源,其经典使用场景主要在于为参赛者提供历年竞赛的问题、输入数据和参考解决方案。通过对这些资料的深入研究,参赛者可以锻炼自己的编程技巧,提高解决复杂问题的能力。
实际应用
在实际应用中,该数据集被广泛应用于算法教学、在线编程平台的问题库构建以及算法竞赛的培训。它不仅帮助编程爱好者提升技能,也为企业选拔技术人才提供了标准化的评估材料。
衍生相关工作
Meta Hacker Cup数据集衍生出了众多相关工作,包括算法分析工具的开发、自动化解题系统的构建以及竞赛结果的数据挖掘研究,这些工作进一步扩展了数据集的应用范围,促进了相关领域的学术交流和技术进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作