llm-system-prompts-benchmark

Name: llm-system-prompts-benchmark
Creator: AIWizards
Published: 2024-07-19T08:54:18+08:00

OpenCSG2024-07-19 更新2026-01-19 收录

语言模型评估

提示工程

数据链接：

https://opencsg.com/datasets/AIWizards/llm-system-prompts-benchmark?tab=summary 数据链接链接失效反馈

官方服务：

资源简介：

该仓库提供了一套用于评估大型语言模型遵循系统提示能力的基准数据集，包含100个系统提示，旨在测试模型在语法模式、多项选择、角色扮演、信息记忆和法语等方面的能力。每个数据点包含提示、探测和评估函数三部分，通过评估模型对提示的遵循程度来衡量其性能。该数据集主要由英文构成，少量法语提示，并采用Apache 2.0协议授权。该仓库还提供了标准化数据操作和统一模型接口，方便研究人员使用该数据集进行模型对比和干预研究。

提供机构：

AIWizards

创建时间：

2024-07-19

llm-system-prompts-benchmark

资源简介：

相关数据集