GYAFC
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/raosudha89/gyafc-corpus
下载链接
链接失效反馈官方服务:
资源简介:
该数据集对每个句子进行了正式与非正式的标注,专注于雅虎问答中家庭与人际关系领域的文本。尽管GYAFC数据集提供了源句子和目标句子的对齐,但在这种无监督问题设置中,这些对齐信息被弃用。此外,拉奥和特雷特劳特(2018年)发布了一组关于GYAFC测试集的人类参考输出。任务内容涉及将正式句子转换为非正式句子,反之亦然。
This dataset annotates each sentence with formal and informal style labels, focusing on texts from the family and interpersonal relationships domain within Yahoo! Answers. Although the GYAFC dataset provides aligned source and target sentence pairs, such alignment information is discarded in this unsupervised task setup. Additionally, Rao and Tetreault (2018) released a set of human reference outputs for the GYAFC test set. The task entails converting formal sentences into informal ones, and vice versa.
提供机构:
Rao and Tetreault
搜集汇总
数据集介绍

背景与挑战
背景概述
GYAFC(Grammarly's Yahoo Answers Formality Corpus)是一个用于形式风格转换研究的语料库,相关论文发表在NAACL 2018上。数据集需通过邮件申请获取,提供者会审核使用目的。
以上内容由遇见数据集搜集并总结生成



