five

devopseval-exam

收藏
魔搭社区2026-01-07 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/codefuse-ai/devopseval-exam
下载链接
链接失效反馈
官方服务:
资源简介:
<!--- 以上YAML section提供属性/tags描述---> <!--- 以下为markdown格式的dataset描述---> DevOps-Eval is a comprehensive chinese evaluation suite specifically designed for foundation models in the DevOps field. It consists of 4850 multi-choice questions spanning 53 diverse categories. Please visit our website and [GitHub](https://github.com/codefuse-ai/codefuse-devops-eval) for more details. Each category consists of two splits: dev, and test. The dev set per subject consists of five exemplars with explanations for few-shot evaluation. And the test set is for model evaluation. Labels on the test split are released, users can evaluate their results and automatically obtain test accuracy. [How to evaluate](https://github.com/codefuse-ai/codefuse-devops-eval#-how-to-evaluate)? #### Notes More details on loading and using the data are at our github page [github](https://github.com/codefuse-ai/codefuse-devops-eval) page.

DevOps-Eval 是一款专为 DevOps 领域基础模型(Foundation Model)打造的综合性中文评测套件。它包含 4850 道多项选择题,涵盖 53 个多样化的任务类别。如需了解更多详情,请访问我们的官方网站及 [GitHub](https://github.com/codefuse-ai/codefuse-devops-eval) 页面。 每个任务类别均包含两个子集:开发集(dev)与测试集(test)。每个类别的开发集包含 5 道附带解析的示例题,用于少样本(Few-shot)评估;测试集则用于模型性能评测。测试集的标签已公开,用户可自行提交评测结果并自动获取测试准确率。[如何进行评测](https://github.com/codefuse-ai/codefuse-devops-eval#-how-to-evaluate)? #### 注意事项 关于数据集的加载与使用的更多细节,请参阅我们的 GitHub 页面 [GitHub](https://github.com/codefuse-ai/codefuse-devops-eval)。
提供机构:
maas
创建时间:
2023-12-28
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作