Watermark Generation Dataset
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/wagner-group/MarkMyWords/blob/main/src/watermark_benchmark/utils/generation_prompts.py
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了296条指令,覆盖了三个长文本生成任务:书评、故事创作和假新闻。此外,该数据集被用于在生成的文本中注入和检测水印信息,旨在完成机器生成文本的水印标记任务。
This dataset consists of 296 instructions, covering three long-form text generation tasks: book review generation, story creation, and fake news generation. Additionally, this dataset is utilized for injecting and detecting watermark information within generated texts, with the goal of completing the watermarking task for machine-generated text.
提供机构:
Wagner Group
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于水印生成基准测试的文本生成数据集,包含多种任务类型,如书评、故事、假新闻、转述、翻译和代码生成,并提供了相应的系统提示和主题列表。数据集旨在生成多样化、结构化的文本数据,以支持对水印技术的评估和比较。
以上内容由遇见数据集搜集并总结生成



