five

CodeI/O-PythonEdu-Reasoning

收藏
github2025-02-21 更新2025-02-13 收录
下载链接:
https://github.com/hkust-nlp/CodeIO
下载链接
链接失效反馈
官方服务:
资源简介:
由于合作伙伴的合规要求,我们只发布了CodeI/O(++)数据集的PythonEdu-Reasoning子集。

Due to the compliance requirements of our partners, we only released the PythonEdu-Reasoning subset of the CodeI/O(++) dataset.
创建时间:
2025-02-08
原始信息汇总

CodeI/O: Condensing Reasoning Patterns via Code Input-Output Prediction

数据集概述

  • 数据集名称: CodeI/O-PythonEdu-Reasoning
  • 数据集链接: CodeI/O-PythonEdu-Reasoning
  • 数据集描述: CodeI/O 是一种新颖的方法,将代码基础的推理模式转换为自然语言格式,以增强大型语言模型的推理能力。这种方法不同于传统的方法,它系统性地提取了通用的推理原语,同时保持程序化的严格性,使模型在各种推理任务上表现更好。

关键特性与贡献

  • 🔄 通用转换:将多样的代码模式转换为自然语言 Chain-of-Thought 推理
  • 🧠 语法解耦:将推理与代码语法分离,同时保留逻辑结构
  • 📊 多任务增强:在符号、科学、逻辑、数学、常识和代码推理任务上提升性能
  • ✨ 完全可验证:支持通过缓存的真实匹配或代码重新执行进行精确预测验证
  • 🚀 高级迭代:增强版(CodeI/O++)支持多轮修订以提高准确性

发布资源

数据集

数据集名称 链接
CodeI/O-PythonEdu-Reasoning 🤗

模型

基础模型/训练 CodeI/O CodeI/O++
Qwen 2.5 7B Coder 🤗 🤗
LLaMA 3.1 8B 🤗 🤗
DeepSeek v2 Lite Coder 🤗 🤗

快速开始

环境设置

提供 requirements.txtenvironment.yaml 两种方式设置环境。

bash conda create -n codeio_exec python 3.11 conda activate codeio_exec pip install -r requirements.txt

bash conda env create -f environment.yaml --name codeio_exec conda activate codeio_exec

数据处理

提供从玩具数据集构建 CodeI/O 数据的完整指南。

训练

可以使用任何流行的训练框架进行模型训练,如 llama-factory

引用

如果您认为这项工作有帮助,请引用以下内容:

@article{li2025codeio, title={CodeI/O: Condensing Reasoning Patterns via Code Input-Output Prediction}, author={Li, Junlong and Guo, Daya and Yang, Dejian and Xu, Runxin and Wu, Yu and He, Junxian}, journal={arXiv preprint arXiv:2502.07316}, year={2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
O-PythonEdu-Reasoning数据集的构建方法是通过对Python代码进行输入输出预测,将代码片段转化为自然语言形式,从而提升大型语言模型的推理能力。此数据集的构建涉及代码的解析、输入输出对的生成、以及预测实例的构建等多个步骤,旨在将代码推理模式转化为自然语言推理模式。
特点
O-PythonEdu-Reasoning数据集的主要特点包括:通用性转换,能够将多样的代码模式转化为自然语言的链式推理;语法解耦,将推理过程从代码语法中分离出来,同时保持逻辑结构;多任务增强,提升模型在符号、科学、逻辑、数学、常识以及代码推理等多方面的性能;完全可验证,支持通过缓存的真实值匹配或代码重新执行来进行精确的预测验证。
使用方法
使用O-PythonEdu-Reasoning数据集时,用户首先需要设置相应的环境,处理数据以构建输入输出预测实例,然后在这些数据上进行模型训练。数据集提供了详细的处理指南,用户可以按照指南进行数据预处理、模型训练以及结果验证等步骤。此外,数据集还支持多轮修订和重新验证,以进一步提高数据的质量和模型的准确性。
背景与挑战
背景概述
O-PythonEdu-Reasoning数据集,由香港科技大学自然语言处理团队于2025年创建,旨在通过代码输入输出预测来压缩推理模式,增强大型语言模型的推理能力。该数据集的核心研究问题是提高模型在符号、科学、逻辑、数学、常识以及代码推理任务中的表现。其贡献包括实现了代码模式向自然语言Chain-of-Thought推理的通用转换,将推理与代码语法解耦,同时保持逻辑结构,并支持精确预测验证。该数据集的发布对于提升自然语言处理模型在代码理解和推理方面的性能具有重要意义。
当前挑战
在构建O-PythonEdu-Reasoning数据集的过程中,研究人员面临了多个挑战。首先,如何将多样化的代码模式有效地转换为自然语言格式,保持其逻辑性和准确性是一个关键挑战。其次,构建过程中需要处理大量的代码样例,并确保推理模式能够适用于不同的编程任务,这对数据集的质量和控制流程提出了较高要求。此外,数据集的构建还需要考虑执行环境的设置,以及如何保证数据处理的效率和准确性。
常用场景
经典使用场景
O-PythonEdu-Reasoning数据集是针对代码推理模式转化为自然语言格式的创新方法CodeI/O而构建的。其经典使用场景在于,通过将代码片段转化为Chain-of-Thought形式的自然语言推理,以增强大型语言模型在各类推理任务中的表现。该数据集特别适用于训练模型理解和生成代码执行的推理过程,进而提升模型在符号推理、科学推理、逻辑推理、数学推理以及常识推理等方面的能力。
实际应用
在实际应用中,O-PythonEdu-Reasoning数据集可以被用于提升编程辅助工具的智能化水平,例如自动化代码审查、代码补全、以及智能编程教育等领域。它通过提供代码与自然语言之间的桥梁,有助于开发出更加智能化的编程辅助系统,从而提高编程效率和代码质量。
衍生相关工作
基于O-PythonEdu-Reasoning数据集,已经衍生出了一系列相关工作,如CodeI/O++模型,它通过引入多轮修订机制进一步提高了推理的准确性。此外,该数据集也促进了针对不同编程语言和场景的推理模型的研究与开发,为编程语言处理和人工智能领域带来了新的研究方向和工具。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作