inkoziev/paraphrases
收藏Hugging Face2023-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/inkoziev/paraphrases
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自对话系统和生成性诗歌项目的短对话片段和诗歌片段的正确和不正确改写。数据集由样本元组组成,每个样本包含两个列表:一个是正确的改写示例,另一个是不正确的改写示例。该数据集用于创建改写检测模型和生成性诗歌改写模型。数据集中改写的语义在特定范围内被允许非保守,例如,某些在语义上较为自由的改写被视为正确。这种特性可能限制了数据集和基于其的模型在某些项目中的适用性。
提供机构:
inkoziev
原始信息汇总
数据集概述
数据集名称
Датасет перефразировок коротких фраз (читчат+поэзия)
数据集内容
- 来源: 包含来自两个项目的文本数据:
- 对话系统项目 (проект диалоговой системы)
- 生成诗歌项目 (проект генеративной поэзии)
- 结构: 数据集由样本-元组列表组成,每个样本包含两个列表:
paraphrases: 正确的重述示例distractors: 错误的重述示例
数据集用途
- 用于训练以下模型:
数据集特点
- 在一定范围内故意允许语义重述的不保守性。
- 包含一定数量的比喻性和相当自由的重述,这可能使得数据集及其模型在某些项目中无法使用。
相关数据集
- 可与其他重述数据集如 tapaco 结合使用。



