TechxGenus/LeetCode-Contest-zh
收藏数据集概述
数据集名称
LeetCode Contest Benchmark
数据集描述
由DeepSeek-Coder提出的一个新基准,用于评估代码大型语言模型(Code LLMs),包含不同难度的最新算法问题。
数据集用途
用于评估和测试代码大型语言模型的性能,通过解决LeetCode中的算法问题来实现。
数据集操作指南
-
克隆数据集仓库: bash git clone https://github.com/deepseek-ai/DeepSeek-Coder.git cd Evaluation/LeetCode
-
设置模型或路径: bash MODEL="deepseek-ai/deepseek-coder-7b-instruct"
-
运行评估脚本: bash python vllm_inference.py --model_name_or_path $MODEL --saved_path output/20240121-Jul.deepseek-coder-7b-instruct.jsonl python evaluate_leetcode.py --generation_path output/20240121-Jul.deepseek-coder-7b-instruct.jsonl --result_path output/20240121-Jul.deepseek-coder-7b-instruct.result.jsonl
数据集许可证
- 许可证名称:deepseek
- 许可证链接:https://huggingface.co/deepseek-ai/deepseek-coder-1.3b-instruct/blob/main/LICENSE
数据集分类
- 任务类别:text-generation
- 语言:zh
- 标签:code
引用信息
@article{guo2024deepseekcoder, title = {DeepSeek-Coder: When the Large Language Model Meets Programming - The Rise of Code Intelligence}, author = {Daya Guo and Qihao Zhu and Dejian Yang and Zhenda Xie and Kai Dong and Wentao Zhang and Guanting Chen and Xiao Bi and Y. Wu and Y. K. Li and Fuli Luo and Yingfei Xiong and Wenfeng Liang}, year = {2024}, journal = {arXiv preprint arXiv: 2401.14196} }




