five

PARAAMR

收藏
arXiv2023-05-26 更新2024-06-21 收录
下载链接:
https://github.com/uclanlp/ParaAMR
下载链接
链接失效反馈
官方服务:
资源简介:
PARAAMR是由加州大学洛杉矶分校等机构创建的一个大规模、句法多样化的释义数据集。该数据集通过抽象意义表示(AMR)反向翻译技术生成,包含约1550万条释义对,旨在解决现有释义数据集在句法多样性上的不足。PARAAMR的创建过程涉及将源句子编码为AMR图,修改AMR图的焦点,线性化修改后的AMR图,并最终解码为句法多样的释义。该数据集主要应用于学习句子嵌入、句法控制的释义生成和数据增强的少量学习场景,以提升自然语言处理(NLP)应用的性能。
提供机构:
加州大学洛杉矶分校
创建时间:
2023-05-26
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作