five

ProofWriter

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ProofWriter
下载链接
链接失效反馈
官方服务:
资源简介:
这些数据集伴随着论文“ProofWriter:在自然语言上生成含义、证明和溯因陈述”。它们包含更新的 RuleTaker 风格的数据集,其中包含 50 万个问题、答案和基于自然语言规则库的证明,用于表明 Transformer 可以模拟对用语言表达的规则进行推理,包括证明生成。它包括使用封闭和开放世界语义的变体。证明包括中间结论。额外的注释提供数据来训练迭代的 ProofWriter 模型以及溯因推理来确定不确定的陈述。

These datasets accompany the paper "ProofWriter: Generating Meaning, Proofs, and Abductive Statements over Natural Language". They contain updated RuleTaker-style datasets consisting of 500,000 question-answer-proof triples grounded in natural language rule bases, designed to demonstrate that Transformers can simulate reasoning over linguistically expressed rules, including proof generation. It includes variants utilizing closed-world and open-world semantics. Proofs include intermediate conclusions. Additional annotations provide data for training iterative ProofWriter models and abductive reasoning to determine uncertain statements.
提供机构:
OpenDataLab
创建时间:
2022-04-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ProofWriter是一个由艾伦人工智能研究所发布的文本数据集,专注于自然语言处理中的逻辑推理和证明生成。它包含50万个基于自然语言规则库的问题、答案和证明,旨在训练Transformer模型模拟推理过程,支持封闭和开放世界语义,并涵盖溯因推理任务。数据集适用于评估与测试、阅读理解及数学推理等领域,采用CC BY 4.0许可,具有较大规模和社区关注度。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作