five

yuan-yang/MALLS-v0

收藏
Hugging Face2023-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yuan-yang/MALLS-v0
下载链接
链接失效反馈
官方服务:
资源简介:
MALLS数据集包含由GPT-4生成的自然语言(NL)语句与对应的一阶逻辑(FOL)规则对。MALLS-v0版本包含34K对,这些对在语法上是正确的,但未进行严格的语义对齐检查。MALLS-v0.1版本则从v0中筛选出28K对,并对其中1K对进行了人工对齐检查。数据集文件包括未过滤的MALLS-v0.json、自动验证的MALLS-v0.1-train.json和人工验证的MALLS-v0.1-test.json,以及从FOLIO数据集中收集和处理的folio_parsed.json。每个条目都是一个包含NL语句和FOL规则的字典对象。

MALLS数据集包含由GPT-4生成的自然语言(NL)语句与对应的一阶逻辑(FOL)规则对。MALLS-v0版本包含34K对,这些对在语法上是正确的,但未进行严格的语义对齐检查。MALLS-v0.1版本则从v0中筛选出28K对,并对其中1K对进行了人工对齐检查。数据集文件包括未过滤的MALLS-v0.json、自动验证的MALLS-v0.1-train.json和人工验证的MALLS-v0.1-test.json,以及从FOLIO数据集中收集和处理的folio_parsed.json。每个条目都是一个包含NL语句和FOL规则的字典对象。
提供机构:
yuan-yang
原始信息汇总

数据集概述

数据集名称

MALLS NL-FOL Pairs 34K

数据集描述

MALLS(大型语言模型生成的自然语言到一阶逻辑对)包含真实世界的自然语言(NL)陈述及其对应的一阶逻辑(FOL)规则注释对。所有对均通过提示GPT-4生成,并经过处理以确保FOL规则的有效性。

数据集版本

  • MALLS-v0: 包含原始的34K NL-FOL对,验证了FOL规则的语法正确性,但未进行严格的配对对齐检查。
  • MALLS-v0.1: 从v0中筛选出的28K NL-FOL对,其中1K样本进行了人工对齐检查,并开发了筛选管道以过滤主数据集。

数据集结构

  • MALLS-v0.json: 包含34K未筛选的MALLS-v0数据集对。
  • MALLS-v0.1-train.jsonMALLS-v0.1-test.json: 分别包含27K自动验证对和1K人工验证对。
  • folio_parsed.json: 包含从FOLIO数据集收集和处理的2K对。

数据集条目格式

{ NL: <the NL statement>, FOL: <the FOL rule> }

许可证

Attribution-NonCommercial 4.0 International

主要用途

MALLS主要用于研究。

引用信息

@article{yang2023harnessing, title={Harnessing the Power of Large Language Models for Natural Language to First-Order Logic Translation}, author={Yuan Yang and Siheng Xiong and Ali Payani and Ehsan Shareghi and Faramarz Fekri}, journal={arXiv preprint arXiv:2305.15541}, year={2023} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作