five

PGDataset

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/ruinunca/pgtask/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了与相关话语对齐的简介句子,这些句子是从对话语料库中提取出来的,用于生成个人简介任务。此外,通过人工评估自动注释的质量,根据蕴含关系的softmax概率来衡量置信度。该任务的目标是从对话中生成个人简介。

This dataset contains brief profile sentences aligned with relevant utterances, which are extracted from conversational corpora and designed for the personal profile generation task. Additionally, the quality of automatic annotations is evaluated manually, with confidence measured by the softmax probability of the entailment relationship. The goal of this task is to generate personal profiles from dialogues.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作