Search4Code
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Search4Code
下载链接
链接失效反馈官方服务:
资源简介:
Search4Code数据集由真实世界的用户查询和相应的最常点击的url组成。每个查询还具有一个标签,该标签表示查询是否具有代码搜索意图,如本文所述的弱监督模型所预测的那样。
目前,Search4Code数据集包含6596个Java查询和4974个C # 查询。
以下是Search4Code数据集的一些优势:
真实查询: 查询是从匿名的Bing搜索日志中采样的。我们相信这提供了个人如何搜索代码的现实表示。
单击url: 每个查询都有一个列表,列出了搜索结果中最常单击的三个url。对于给定的搜索查询,最常单击的url代表提供令人满意的解决方案的搜索结果。
人气评分: 每个查询都会根据出现的频率分配一个人气等级。
大规模: 数据集包含数千个查询。因此,可以使用需要大量训练数据的更复杂的模型。
提供机构:
OpenDataLab
创建时间:
2022-11-02



