five

SamSJackson/kpar3-no-ctx

收藏
Hugging Face2024-03-19 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/SamSJackson/kpar3-no-ctx
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit size_categories: - 100K<n<1M --- # KPar3 - Dataset ## Description The dataset is leveraged from the [Par3](https://github.com/katherinethai/par3) dataset. Original dataset is created by Krishna in a paper about retrieval defense on watermarking: [Paper](https://arxiv.org/pdf/2303.13408.pdf) The uploaded dataset is a sampled version, with 100,000 training samples and 20,000 validation samples. Furthermore, only the non-context documents are sampled from the dataset. ## Usage This dataset was used to finetune the following model: [paraphrase-dipper-no-ctx](https://huggingface.co/SamSJackson/paraphrase-dipper-no-ctx)
提供机构:
SamSJackson
原始信息汇总

KPar3 - Dataset 概述

数据集来源

  • 本数据集是从 Par3 数据集采样而来。

原始数据集创建者

  • 原始数据集由 Krishna 创建,相关研究论文见 Paper

数据集内容

  • 上传的数据集为采样版本,包含 100,000 个训练样本和 20,000 个验证样本。
  • 仅从数据集中采样了非上下文文档。

数据集规模

  • 数据集大小属于 100K<n<1M 类别。

使用情况

许可证

  • 数据集遵循 MIT 许可证。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作