yuan-yang/MALLS-v0
收藏Hugging Face2023-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yuan-yang/MALLS-v0
下载链接
链接失效反馈官方服务:
资源简介:
MALLS数据集包含由GPT-4生成的自然语言(NL)语句与对应的一阶逻辑(FOL)规则对。MALLS-v0版本包含34K对,这些对在语法上是正确的,但未进行严格的语义对齐检查。MALLS-v0.1版本则从v0中筛选出28K对,并对其中1K对进行了人工对齐检查。数据集文件包括未过滤的MALLS-v0.json、自动验证的MALLS-v0.1-train.json和人工验证的MALLS-v0.1-test.json,以及从FOLIO数据集中收集和处理的folio_parsed.json。每个条目都是一个包含NL语句和FOL规则的字典对象。
MALLS数据集包含由GPT-4生成的自然语言(NL)语句与对应的一阶逻辑(FOL)规则对。MALLS-v0版本包含34K对,这些对在语法上是正确的,但未进行严格的语义对齐检查。MALLS-v0.1版本则从v0中筛选出28K对,并对其中1K对进行了人工对齐检查。数据集文件包括未过滤的MALLS-v0.json、自动验证的MALLS-v0.1-train.json和人工验证的MALLS-v0.1-test.json,以及从FOLIO数据集中收集和处理的folio_parsed.json。每个条目都是一个包含NL语句和FOL规则的字典对象。
提供机构:
yuan-yang
原始信息汇总
数据集概述
数据集名称
MALLS NL-FOL Pairs 34K
数据集描述
MALLS(大型语言模型生成的自然语言到一阶逻辑对)包含真实世界的自然语言(NL)陈述及其对应的一阶逻辑(FOL)规则注释对。所有对均通过提示GPT-4生成,并经过处理以确保FOL规则的有效性。
数据集版本
- MALLS-v0: 包含原始的34K NL-FOL对,验证了FOL规则的语法正确性,但未进行严格的配对对齐检查。
- MALLS-v0.1: 从v0中筛选出的28K NL-FOL对,其中1K样本进行了人工对齐检查,并开发了筛选管道以过滤主数据集。
数据集结构
MALLS-v0.json: 包含34K未筛选的MALLS-v0数据集对。MALLS-v0.1-train.json和MALLS-v0.1-test.json: 分别包含27K自动验证对和1K人工验证对。folio_parsed.json: 包含从FOLIO数据集收集和处理的2K对。
数据集条目格式
{ NL: <the NL statement>, FOL: <the FOL rule> }
许可证
Attribution-NonCommercial 4.0 International
主要用途
MALLS主要用于研究。
引用信息
@article{yang2023harnessing, title={Harnessing the Power of Large Language Models for Natural Language to First-Order Logic Translation}, author={Yuan Yang and Siheng Xiong and Ali Payani and Ehsan Shareghi and Faramarz Fekri}, journal={arXiv preprint arXiv:2305.15541}, year={2023} }



