five

gabeorlanski/tp3

收藏
Hugging Face2023-07-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gabeorlanski/tp3
下载链接
链接失效反馈
官方服务:
资源简介:
Translating Python Programming Puzzles (TP3)数据集是从Python Programming Puzzles数据集的验证函数中创建的,用于检查答案是否满足谜题的约束。这些谜题的难度从基本字符检查到竞争性编程问题不等。数据集支持多种编程语言,包括C++、C#、Dart、Go、Haskell、Java、Javascript、Julia、Kotlin、Lua、PHP、R、Rust、Scala和TypeScript。数据集的结构包括问题ID、标题、编程语言、问题描述、签名、带文档字符串的签名、参数、源代码和问题信息等字段。数据集的创建过程详见BabelCode论文的第2节和第4.4节,原始P3数据集的收集过程详见Programming Puzzles论文。数据集由Google Research维护,许可信息为CC-BY-4.0。

Translating Python Programming Puzzles (TP3)数据集是从Python Programming Puzzles数据集的验证函数中创建的,用于检查答案是否满足谜题的约束。这些谜题的难度从基本字符检查到竞争性编程问题不等。数据集支持多种编程语言,包括C++、C#、Dart、Go、Haskell、Java、Javascript、Julia、Kotlin、Lua、PHP、R、Rust、Scala和TypeScript。数据集的结构包括问题ID、标题、编程语言、问题描述、签名、带文档字符串的签名、参数、源代码和问题信息等字段。数据集的创建过程详见BabelCode论文的第2节和第4.4节,原始P3数据集的收集过程详见Programming Puzzles论文。数据集由Google Research维护,许可信息为CC-BY-4.0。
提供机构:
gabeorlanski
原始信息汇总

数据集概述

数据集名称

  • 名称: BabelCode TP3
  • 别名: Translating Python Programming Puzzles (TP3)

数据集描述

  • 来源: 由Python Programming Puzzles数据集(Schuster et al., 2021)中的验证函数创建。
  • 目的: 用于检查答案是否满足谜题的约束。
  • 难度范围: 从基本的字符检查到竞争编程问题。

支持的任务

  • 任务类别: 文本生成、文本到文本生成、翻译

语言支持

  • 源语言: 英语
  • 目标语言: C++, C#, Dart, Go, Haskell, Java, Javascript, Julia, Kotlin, Lua, PHP, R, Rust, Scala, TypeScript

数据集结构

  • 数据集类型: DatasetDict
  • 测试集大小: 5920行
  • 数据字段:
    • qid: 问题ID
    • title: 问题标题
    • language: 编程语言
    • text: 问题描述
    • signature: 问题签名
    • signature_with_docstring: 带文档字符串的问题签名
    • arguments: 问题参数
    • source: Python源解决方案
    • question_info: 包含测试代码、测试列表、测试案例ID、入口函数名、入口类名、命令、超时和扩展名的字典

许可证

  • 许可证: Apache-2.0

数据集创建

  • 创建方法: 参考BabelCode Paper的第2节和第4.4节。
  • 原始数据集收集: 参考Programming Puzzles paper。

数据集维护者

  • 维护者: Google Research

引用信息

@article{orlanski2023measuring, title={Measuring The Impact Of Programming Language Distribution}, author={Orlanski, Gabriel and Xiao, Kefan and Garcia, Xavier and Hui, Jeffrey and Howland, Joshua and Malmaud, Jonathan and Austin, Jacob and Singh, Rishah and Catasta, Michele}, journal={arXiv preprint arXiv:2302.01973}, year={2023} } @inproceedings{ schuster2021programming, title={Programming Puzzles}, author={Tal Schuster and Ashwin Kalyan and Alex Polozov and Adam Tauman Kalai}, booktitle={Thirty-fifth Conference on Neural Information Processing Systems Datasets and Benchmarks Track}, year={2021}, url={https://arxiv.org/abs/2106.05784} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作