five

Wuyanzzh/sex

收藏
Hugging Face2026-04-16 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Wuyanzzh/sex
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-nc-4.0 task_categories: - text-generation - text2text-generation language: - zh tags: - porn - Pre-training - Fine-tuning - Explicit Content - Chinese - Erotic Literature pretty_name: Chinese Porn Literature Collection size_categories: - 10K<n<100K --- [English](README.en.md) # 中文色情文学数据集合集 ## 概述 本仓库包含了51个中文色情文学数据集。每个数据集由短篇色情小说、个人色情经验及其他形式的色情内容组成。数据集的格式为JSON,每个文件包含一个对象数组,每个对象代表一篇文档: ```json [ {"text": "document"}, {"text": "document"} ] ``` 这些数据集可用于语言模型的预训练,经过适当调整后也可用于模型的微调。 ## 数据集格式 - **文件格式:** JSON - **内容:** 短篇色情小说、个人色情经验及其他色情内容 - **结构:** - 每个文件包含一个对象数组 - 每个对象包含一个键 `"text"`,其值为相应的文档内容 ## 使用方法 这些数据集主要用于研究目的,特别是在语言模型的开发和微调中使用。由于内容的敏感性,用户应谨慎处理这些数据集,并确保遵守当地的法律法规及相关指导原则。 ### 示例用法 ```python import json # 加载数据集 with open('path_to_json_file.json', 'r', encoding='utf-8') as file: data = json.load(file) # 访问文本内容 for document in data: print(document['text']) ``` ## 免责声明 本数据集的内容为成人色情内容,仅供研究使用。数据集中可能包含冒犯性或不适当的内容。使用这些数据集即表示您同意自行承担使用后果。用户必须确保在使用或分发这些数据集之前遵守其所在司法管辖区的所有适用法律和法规。本数据集的创建者对因使用本数据集内容而导致的任何不当行为不承担任何责任。
提供机构:
Wuyanzzh
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作