OracleProto
收藏OracleProto 预测评估数据集
数据集概览
| 字段 | 值 |
|---|---|
| 发布日期 | 2026-04-29 |
| 数据行数 | 80 |
| 数据划分 | train (80行);单划分,作为留出评估集 |
| 问题解决日期范围 | 2026-03-12 → 2026-04-14 |
| 问题类型 | yes_no, binary_named, multiple_choice |
| 选择类型 | single (一个正确答案字母), multi (一个或多个正确答案字母) |
| 数据库文件 | forecast_eval_set_example.db (SQLite 3, ~52 KB) |
| 文件中的表 | forecast_eval_set_example (80行), dataset_metadata (1行) |
| 许可证 | MIT |
| 上游来源 | HuggingFace forecasting questions (等级1+2), 322条原始数据筛选为80条 |
问题类型分布
question_type |
choice_type |
行数 |
|---|---|---|
yes_no |
single |
37 |
binary_named |
single |
3 |
multiple_choice |
single |
32 |
multiple_choice |
multi |
8 |
| 总计 | 80 |
文件结构
OracleProto/ ├── forecast_eval_set_example.db # SQLite数据库文件(数据集主体,~52 KB) ├── forecast_eval_set_example.csv # 行表的CSV导出文件;80行+表头(~18 KB) ├── README.md # 本文件 ├── LICENSE # MIT许可证 └── .gitattributes # 标准HF二进制属性文件
数据库模式
表 forecast_eval_set_example(数据行)
| 列名 | 类型 | 描述 |
|---|---|---|
id |
TEXT | 稳定的上游问题ID,主键 |
choice_type |
TEXT | single或multi,根据答案字母数推导 |
question_type |
TEXT | yes_no, binary_named, multiple_choice之一 |
event |
TEXT | 预测事件的自然语言描述 |
options |
TEXT | 选项标签的JSON数组 |
answer |
TEXT | 正确答案字母编码 |
end_time |
TEXT | 解决日期 (YYYY-MM-DD) |
表 dataset_metadata(配方)
| 列名 | 类型 | 描述 |
|---|---|---|
dataset_name |
TEXT | 数据集名称 |
split_name |
TEXT | 划分名称 |
table_name |
TEXT | 表名 |
row_count |
INTEGER | 行数 |
imported_at_utc |
TEXT | 导入时间 |
features_json |
TEXT | 提示模板、输出格式等元数据 |
提示重建规范
静态片段
- agent_role:
"You are an agent that can predict future events." - guidance: 禁止使用其他格式,禁止拒绝预测,必须基于最佳可用数据做出清晰预测
主模板
{agent_role} The event to be predicted: "{event} (resolved around {end_time} (GMT+8)).{outcomes_block}"
IMPORTANT: Your final answer MUST end with this exact format: {output_format} {guidance}
输出格式(四种)
- yes_no:
oxed{Yes} 或 oxed{No} - binary_named:
oxed{<options[0]>} 或 oxed{<options[1]>} - multiple_choice (single):
oxed{A}(仅单个字母) - multiple_choice (multi):
oxed{A}或oxed{B, C}(逗号分隔)
答案解析规则
- 取模型回复中最后一个
oxed{...}子串 - yes_no: 不区分大小写,
Yes→A,No→B - binary_named: 不区分大小写,匹配选项文本
- multiple_choice: 按逗号和空格分割,验证每个字母为有效选项索引
- 分数:严格集合相等性比较
样本数据行
json { "id": "699d9ffc098cca008728b6f0", "choice_type": "single", "question_type": "yes_no", "event": "2026年1月美国PCE年通胀率会大于2.9%吗?", "options": ["Yes", "No"], "answer": "B", "end_time": "2026-03-13" }
json { "id": "69a2e39e5692ef005cdbf2d3", "choice_type": "single", "question_type": "binary_named", "event": "美国还是以色列会先打击伊朗?", "options": ["US", "Israel"], "answer": "B", "end_time": "2026-03-31" }
json { "id": "6995b1073ea64b005b11f285", "choice_type": "single", "question_type": "multiple_choice", "event": "2025-26赛季哪支男子篮球队将赢得Big 12联盟锦标赛冠军?", "options": ["Arizona", "Baylor", "Brigham Young University (BYU)", "Houston", "Iowa State", "Kansas", "Kansas State"], "answer": "A", "end_time": "2026-03-14" }
json { "id": "698f198bda7a8b006575444c", "choice_type": "multi", "question_type": "multiple_choice", "event": "哪些电影将赢得多个奥斯卡奖?(2026年)", "options": ["One Battle After Another", "Sinners", "Frankenstein", "KPop Demon Hunters", "F1", "Sentimental Value", "Hamnet", "Marty Supreme", "The Secret Agent", "Avatar: Fire and Ash", "Train Dreams", "Bugonia", "Blue Moon", "It Was Just An Accident"], "answer": "A, B, C, D", "end_time": "2026-03-15" }




