five

mj33/SimCoPilot

收藏
Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mj33/SimCoPilot
下载链接
链接失效反馈
官方服务:
资源简介:
SimCoPilot是一个用于评估大型语言模型(LLMs)作为交互式编码助手能力的基准测试。它测试LLMs在复杂现实世界软件环境中添加和完成代码的能力,并分析LLMs如何管理不同的代码依赖和逻辑复杂性。数据集包含Python和Java代码,主要用于程序合成、基准测试和研究新编码工具的开发。数据集结构包括11个字段,详细描述了代码任务的类型、代码段的位置、代码的前后内容以及逻辑组件的使用情况。数据集的创建过程涉及从Rice大学的计算机科学、电气工程和统计部门收集代码,并由研究生团队进行注释。数据集存在样本偏差和过拟合风险,建议通过多样化数据源和外部数据集交叉验证来缓解这些问题。
提供机构:
mj33
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作