five

alevkov95/text2log

收藏
Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/alevkov95/text2log
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为text2log,主要用于将自然语言文本翻译为一阶逻辑(FOL)语句。数据集包含从enTenTen15中筛选出的100,000条简单英语句子及其通过ccg2lambda工具生成的FOL翻译。数据集的结构包括两个主要字段:clean表示简单的英语句子,trans表示对应的Lambda Dependency-based Compositional Semantics翻译。数据集的创建目的是改进从自然文本生成FOL语句的能力。数据集的注释是机器生成的,不包含个人或敏感信息。

该数据集名为text2log,主要用于将自然语言文本翻译为一阶逻辑(FOL)语句。数据集包含从enTenTen15中筛选出的100,000条简单英语句子及其通过ccg2lambda工具生成的FOL翻译。数据集的结构包括两个主要字段:clean表示简单的英语句子,trans表示对应的Lambda Dependency-based Compositional Semantics翻译。数据集的创建目的是改进从自然文本生成FOL语句的能力。数据集的注释是机器生成的,不包含个人或敏感信息。
提供机构:
alevkov95
原始信息汇总

数据集概述

数据集名称

  • 名称:text2log

数据集属性

  • 语言:英语(en)
  • 多语言性:单语
  • 许可证:未知
  • 大小:100K<n<1M
  • 来源:原始数据
  • 任务类别:翻译

数据集结构

  • 特征
    • sentence:字符串类型
    • fol_translation:字符串类型
  • 数据分割
    • 训练集
      • 字节数:10358134
      • 示例数:101931
    • 下载大小:9746473
    • 数据集大小:10358134

数据实例

  • 示例

    { clean:All things that are new are good., trans:all x1.(_thing(x1) -> (_new(x1) -> _good(x1))) }

数据字段

  • clean:简单的英语句子
  • trans:对应的Lambda Dependency-based Compositional Semantics翻译

数据创建

  • 来源数据
    • 初始数据收集和规范化:从enTenTen15选取的短文本样本
    • 源语言生产者:参见https://www.sketchengine.eu/ententen-english-corpus/
  • 注释
    • 注释过程:机器生成,使用https://github.com/mynlp/ccg2lambda
    • 注释者:无

使用数据考虑

  • 许可证信息:未提供
  • 引用信息: bibtex @INPROCEEDINGS{9401852, author={Levkovskyi, Oleksii and Li, Wei}, booktitle={SoutheastCon 2021}, title={Generating Predicate Logic Expressions from Natural Language}, year={2021}, volume={}, number={}, pages={1-8}, doi={10.1109/SoutheastCon45413.2021.9401852} }
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作