alevkov95/text2log
收藏Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/alevkov95/text2log
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为text2log,主要用于将自然语言文本翻译为一阶逻辑(FOL)语句。数据集包含从enTenTen15中筛选出的100,000条简单英语句子及其通过ccg2lambda工具生成的FOL翻译。数据集的结构包括两个主要字段:clean表示简单的英语句子,trans表示对应的Lambda Dependency-based Compositional Semantics翻译。数据集的创建目的是改进从自然文本生成FOL语句的能力。数据集的注释是机器生成的,不包含个人或敏感信息。
该数据集名为text2log,主要用于将自然语言文本翻译为一阶逻辑(FOL)语句。数据集包含从enTenTen15中筛选出的100,000条简单英语句子及其通过ccg2lambda工具生成的FOL翻译。数据集的结构包括两个主要字段:clean表示简单的英语句子,trans表示对应的Lambda Dependency-based Compositional Semantics翻译。数据集的创建目的是改进从自然文本生成FOL语句的能力。数据集的注释是机器生成的,不包含个人或敏感信息。
提供机构:
alevkov95
原始信息汇总
数据集概述
数据集名称
- 名称:text2log
数据集属性
- 语言:英语(en)
- 多语言性:单语
- 许可证:未知
- 大小:100K<n<1M
- 来源:原始数据
- 任务类别:翻译
数据集结构
- 特征:
- sentence:字符串类型
- fol_translation:字符串类型
- 数据分割:
- 训练集:
- 字节数:10358134
- 示例数:101931
- 下载大小:9746473
- 数据集大小:10358134
- 训练集:
数据实例
-
示例:
{ clean:All things that are new are good., trans:all x1.(_thing(x1) -> (_new(x1) -> _good(x1))) }
数据字段
- clean:简单的英语句子
- trans:对应的Lambda Dependency-based Compositional Semantics翻译
数据创建
- 来源数据:
- 初始数据收集和规范化:从enTenTen15选取的短文本样本
- 源语言生产者:参见https://www.sketchengine.eu/ententen-english-corpus/
- 注释:
- 注释过程:机器生成,使用https://github.com/mynlp/ccg2lambda
- 注释者:无
使用数据考虑
- 许可证信息:未提供
- 引用信息: bibtex @INPROCEEDINGS{9401852, author={Levkovskyi, Oleksii and Li, Wei}, booktitle={SoutheastCon 2021}, title={Generating Predicate Logic Expressions from Natural Language}, year={2021}, volume={}, number={}, pages={1-8}, doi={10.1109/SoutheastCon45413.2021.9401852} }



