strategy-scope/res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059

Name: strategy-scope/res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059
Creator: strategy-scope
Published: 2026-04-07 17:03:49
License: 暂无描述

Hugging Face2026-04-07 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/strategy-scope/res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059

下载链接

链接失效反馈

官方服务：

资源简介：

--- tags: - strategy-scope - CREATE - evaluation --- # res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059 Evaluation results for `strategy-scope/exp_base-prompt-165-gpt4.1mini_20260407_121851`. ## Aggregate Statistics | Metric | Value | |--------|-------| | Instances | 165 | | Avg paths/instance | 13.8 | | Avg path length | 3.1 | | Avg valid/instance | 12.6 | | Avg valid & factual/instance | 4.7 | | Avg factuality | 0.6783 | | Avg strength | 2.7773 | | Avg pairwise distance (ft=0.0) | 0.6963 | | Avg pairwise distance (ft=1.0) | 0.5285 | | Avg utility (ft=0.0) | 16.3753 | | Avg utility (ft=1.0) | 7.7072 | ## Parameters - **Eval model:** gpt-4o-mini - **Patience:** 0.9 - **Total eval calls:** 4570 - **Timestamp:** 20260407_130059

--- 标签： - 策略范围（strategy-scope） - CREATE - 评估 --- # res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059 针对`策略范围（strategy-scope）/exp_base-prompt-165-gpt4.1mini_20260407_121851`的评估结果。 ## 汇总统计指标 | 指标 | 数值 | |--------|-------| | 实例总数 | 165 | | 单实例平均路径数 | 13.8 | | 平均路径长度 | 3.1 | | 单实例平均有效路径数 | 12.6 | | 单实例平均有效且符合事实的路径数 | 4.7 | | 平均事实一致性 | 0.6783 | | 平均强度 | 2.7773 | | 平均成对距离（ft=0.0） | 0.6963 | | 平均成对距离（ft=1.0） | 0.5285 | | 平均效用（ft=0.0） | 16.3753 | | 平均效用（ft=1.0） | 7.7072 | ## 参数设置 - **评估模型（Eval model）：** gpt-4o-mini - **早停耐心值（Patience）：** 0.9 - **总评估调用次数：** 4570 - **时间戳：** 20260407_130059

提供机构：

strategy-scope

5,000+

优质数据集

54 个

任务类型

进入经典数据集