SamSJackson/kpar3-no-ctx
收藏Hugging Face2024-03-19 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/SamSJackson/kpar3-no-ctx
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
size_categories:
- 100K<n<1M
---
# KPar3 - Dataset
## Description
The dataset is leveraged from the [Par3](https://github.com/katherinethai/par3) dataset.
Original dataset is created by Krishna in a paper about retrieval defense on watermarking: [Paper](https://arxiv.org/pdf/2303.13408.pdf)
The uploaded dataset is a sampled version, with 100,000 training samples and 20,000 validation samples.
Furthermore, only the non-context documents are sampled from the dataset.
## Usage
This dataset was used to finetune the following model: [paraphrase-dipper-no-ctx](https://huggingface.co/SamSJackson/paraphrase-dipper-no-ctx)
提供机构:
SamSJackson
原始信息汇总
KPar3 - Dataset 概述
数据集来源
- 本数据集是从 Par3 数据集采样而来。
原始数据集创建者
- 原始数据集由 Krishna 创建,相关研究论文见 Paper。
数据集内容
- 上传的数据集为采样版本,包含 100,000 个训练样本和 20,000 个验证样本。
- 仅从数据集中采样了非上下文文档。
数据集规模
- 数据集大小属于 100K<n<1M 类别。
使用情况
- 该数据集用于微调模型 paraphrase-dipper-no-ctx。
许可证
- 数据集遵循 MIT 许可证。



