five

strategy-scope/res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059

收藏
Hugging Face2026-04-07 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/strategy-scope/res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059
下载链接
链接失效反馈
官方服务:
资源简介:
--- tags: - strategy-scope - CREATE - evaluation --- # res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059 Evaluation results for `strategy-scope/exp_base-prompt-165-gpt4.1mini_20260407_121851`. ## Aggregate Statistics | Metric | Value | |--------|-------| | Instances | 165 | | Avg paths/instance | 13.8 | | Avg path length | 3.1 | | Avg valid/instance | 12.6 | | Avg valid & factual/instance | 4.7 | | Avg factuality | 0.6783 | | Avg strength | 2.7773 | | Avg pairwise distance (ft=0.0) | 0.6963 | | Avg pairwise distance (ft=1.0) | 0.5285 | | Avg utility (ft=0.0) | 16.3753 | | Avg utility (ft=1.0) | 7.7072 | ## Parameters - **Eval model:** gpt-4o-mini - **Patience:** 0.9 - **Total eval calls:** 4570 - **Timestamp:** 20260407_130059

--- 标签: - 策略范围(strategy-scope) - CREATE - 评估 --- # res_exp_base-prompt-165-gpt4.1mini_20260407_121851-20260407_130059 针对`策略范围(strategy-scope)/exp_base-prompt-165-gpt4.1mini_20260407_121851`的评估结果。 ## 汇总统计指标 | 指标 | 数值 | |--------|-------| | 实例总数 | 165 | | 单实例平均路径数 | 13.8 | | 平均路径长度 | 3.1 | | 单实例平均有效路径数 | 12.6 | | 单实例平均有效且符合事实的路径数 | 4.7 | | 平均事实一致性 | 0.6783 | | 平均强度 | 2.7773 | | 平均成对距离(ft=0.0) | 0.6963 | | 平均成对距离(ft=1.0) | 0.5285 | | 平均效用(ft=0.0) | 16.3753 | | 平均效用(ft=1.0) | 7.7072 | ## 参数设置 - **评估模型(Eval model):** gpt-4o-mini - **早停耐心值(Patience):** 0.9 - **总评估调用次数:** 4570 - **时间戳:** 20260407_130059
提供机构:
strategy-scope
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作