five

Lyra

收藏
魔搭社区2025-10-14 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Lyra
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: Lyra labelTypes: - Text - Chinese Corpus license: - GPL-3.0 mediaTypes: - Text paperUrl: https://arxiv.org/pdf/2108.12144v1.pdf publishDate: "2021" publishUrl: https://github.com/liangqingyuan/lyra publisher: - Peking University tags: - Code taskTypes: - Code Generation --- # 数据集介绍 ## 简介 Lyra 是一个用于代码生成的数据集,由带有嵌入式 SQL 的 Python 代码组成。该数据集包含来自实际使用项目的 2,000 个经过仔细注释的数据库操作程序。每个程序都配有中文评论和英文评论。 ## 引文 ``` "@article{liang2021lyra, title={Lyra: A Benchmark for Turducken-Style Code Generation}, author={Liang, Qingyuan and Sun, Zeyu and Zhu, Qihao and Zhang, Wenjie and Yu, Lian and Xiong, Yingfei and Zhang, Lu}, journal={arXiv preprint arXiv:2108.12144}, year={2021} }" ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称:Lyra 标签类型: - 文本(Text) - 中文语料库(Chinese Corpus) 授权协议: - GPL-3.0 媒体类型: - 文本(Text) 论文链接:https://arxiv.org/pdf/2108.12144v1.pdf 发布年份:"2021" 项目仓库链接:https://github.com/liangqingyuan/lyra 发布机构: - 北京大学(Peking University) 标签: - 代码(Code) 任务类型: - 代码生成(Code Generation) --- # 数据集介绍 ## 简介 Lyra是一款面向代码生成任务的数据集,其数据样本均为嵌入SQL语句的Python代码。该数据集收录了来自真实生产项目的2000条经细致注释的数据库操作程序,每条程序均配有中文与英文双语注释。 ## 引用 "@article{liang2021lyra, title={Lyra: A Benchmark for Turducken-Style Code Generation}, author={Liang, Qingyuan and Sun, Zeyu and Zhu, Qihao and Zhang, Wenjie and Yu, Lian and Xiong, Yingfei and Zhang, Lu}, journal={arXiv preprint arXiv:2108.12144}, year={2021} }" ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作