gallifantjack/pminervini_NQ_Swap_org_answer
收藏Hugging Face2024-12-11 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/gallifantjack/pminervini_NQ_Swap_org_answer
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含pminervini_NQ_Swap的评估结果,带有标签列org_answer,以及各种模型性能指标和样本。数据集包含评估过程中的原始样本,以及模型名称、输入列和得分等元数据,有助于理解模型在不同任务和数据集中的表现。数据集的特征包括样本的唯一标识符、用户查询/内容、助手响应、预期输出、助手响应的得分、得分解释、原始数据集中使用的输入列、原始数据集中的标签列、评估中使用的模型名称以及原始数据集的名称。该数据集可用于评估模型在不同任务中的鲁棒性、评估模型响应中的潜在偏见以及模型性能的监控和分析。
This dataset contains evaluation results for pminervini_NQ_Swap with label column org_answer, with various model performance metrics and samples. The dataset features include a unique identifier for the sample, user query, assistant response, expected output, score of the assistants response, explanation of the score, input column, label column, model name, and original dataset name. This dataset can be used for evaluating model robustness across various tasks, assessing potential biases in model responses, and model performance monitoring and analysis.
提供机构:
gallifantjack



