网文数据集
收藏贵州省数据知识产权登记平台2026-03-12 更新2026-03-13 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=2395&type=1
下载链接
链接失效反馈官方服务:
资源简介:
来源与清洗规则:数据源自合法授权文本,经过去重、去噪、去敏感信息、去广告与无效片段清洗,保证文本纯净度。
版权与使用约束:遵循著作权及平台授权协议,仅用于合规 AI 模型训练,不支持二次分发、商用转售及侵权用途。
Source and Cleaning Rules: The data is sourced from legally authorized texts, and has been cleaned through deduplication, denoising, sensitive information removal, advertisement and invalid fragment removal to ensure text purity. Copyright and Usage Restrictions: This dataset complies with copyright laws and platform authorization agreements, and is only intended for compliant AI model training. Secondary distribution, commercial resale and infringing uses are not permitted.
提供机构:
中文在线集团股份有限公司
创建时间:
2026-03-03
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个经过严格清洗的网络文学作品集合,数据源自合法授权文本,通过去重、去噪、去敏感信息等多重处理确保文本纯净度。数据集遵循著作权协议,仅允许用于合规的AI模型训练,禁止二次分发、商用转售及侵权用途。
以上内容由遇见数据集搜集并总结生成



