strategy-scope/res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059
收藏Hugging Face2026-04-07 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/strategy-scope/res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059
下载链接
链接失效反馈官方服务:
资源简介:
---
tags:
- strategy-scope
- CREATE
- evaluation
---
# res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059
Evaluation results for `strategy-scope/exp_base-prompt-165-gpt4.1mini_20260407_121851`.
## Aggregate Statistics
| Metric | Value |
|--------|-------|
| Instances | 165 |
| Avg paths/instance | 13.8 |
| Avg path length | 3.1 |
| Avg valid/instance | 12.6 |
| Avg valid & factual/instance | 4.7 |
| Avg factuality | 0.6783 |
| Avg strength | 2.7773 |
| Avg pairwise distance (ft=0.0) | 0.6963 |
| Avg pairwise distance (ft=1.0) | 0.5285 |
| Avg utility (ft=0.0) | 16.3753 |
| Avg utility (ft=1.0) | 7.7072 |
## Parameters
- **Eval model:** gpt-4o-mini
- **Patience:** 0.9
- **Total eval calls:** 4570
- **Timestamp:** 20260407_130059
---
标签:
- 策略范围(strategy-scope)
- CREATE
- 评估
---
# res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059
针对`策略范围(strategy-scope)/exp_base-prompt-165-gpt4.1mini_20260407_121851`的评估结果。
## 汇总统计指标
| 指标 | 数值 |
|--------|-------|
| 实例总数 | 165 |
| 单实例平均路径数 | 13.8 |
| 平均路径长度 | 3.1 |
| 单实例平均有效路径数 | 12.6 |
| 单实例平均有效且符合事实的路径数 | 4.7 |
| 平均事实一致性 | 0.6783 |
| 平均强度 | 2.7773 |
| 平均成对距离(ft=0.0) | 0.6963 |
| 平均成对距离(ft=1.0) | 0.5285 |
| 平均效用(ft=0.0) | 16.3753 |
| 平均效用(ft=1.0) | 7.7072 |
## 参数设置
- **评估模型(Eval model):** gpt-4o-mini
- **早停耐心值(Patience):** 0.9
- **总评估调用次数:** 4570
- **时间戳:** 20260407_130059
提供机构:
strategy-scope



