Lyra
收藏魔搭社区2025-10-14 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Lyra
下载链接
链接失效反馈官方服务:
资源简介:
displayName: Lyra
labelTypes:
- Text
- Chinese Corpus
license:
- GPL-3.0
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2108.12144v1.pdf
publishDate: "2021"
publishUrl: https://github.com/liangqingyuan/lyra
publisher:
- Peking University
tags:
- Code
taskTypes:
- Code Generation
---
# 数据集介绍
## 简介
Lyra 是一个用于代码生成的数据集,由带有嵌入式 SQL 的 Python 代码组成。该数据集包含来自实际使用项目的 2,000 个经过仔细注释的数据库操作程序。每个程序都配有中文评论和英文评论。
## 引文
```
"@article{liang2021lyra,
title={Lyra: A Benchmark for Turducken-Style Code Generation},
author={Liang, Qingyuan and Sun, Zeyu and Zhu, Qihao and Zhang, Wenjie and Yu, Lian and Xiong, Yingfei and Zhang, Lu},
journal={arXiv preprint arXiv:2108.12144},
year={2021}
}"
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:Lyra
标签类型:
- 文本(Text)
- 中文语料库(Chinese Corpus)
授权协议:
- GPL-3.0
媒体类型:
- 文本(Text)
论文链接:https://arxiv.org/pdf/2108.12144v1.pdf
发布年份:"2021"
项目仓库链接:https://github.com/liangqingyuan/lyra
发布机构:
- 北京大学(Peking University)
标签:
- 代码(Code)
任务类型:
- 代码生成(Code Generation)
---
# 数据集介绍
## 简介
Lyra是一款面向代码生成任务的数据集,其数据样本均为嵌入SQL语句的Python代码。该数据集收录了来自真实生产项目的2000条经细致注释的数据库操作程序,每条程序均配有中文与英文双语注释。
## 引用
"@article{liang2021lyra,
title={Lyra: A Benchmark for Turducken-Style Code Generation},
author={Liang, Qingyuan and Sun, Zeyu and Zhu, Qihao and Zhang, Wenjie and Yu, Lian and Xiong, Yingfei and Zhang, Lu},
journal={arXiv preprint arXiv:2108.12144},
year={2021}
}"
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01



