five

a686d380/h-corpus-raw

收藏
Hugging Face2023-10-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/a686d380/h-corpus-raw
下载链接
链接失效反馈
官方服务:
资源简介:
--- viewer: false language: - zh --- 未清洗的中文H小说 | 数据| 文章数| 解压后大小 | 来源 | 质量 | 备注| |- | - |- | - | - | - | |jjsw | 73,432 | 4.0 GB | 禁忌书屋 | 高 | - | |pixiv-selected | 2,935 | 174.3 MB | pixiv排行版 | 高 | - | |shubao | 6,776 |1.6 GB | 网络 | 低 | - | |sis-long | 4,555 | 3.5 GB | sis | 中 | - | |sis-short | 111,237 | 4.1 GB | sis | 中 | - | |xbookcn | 39,798 | 1.0 GB | xbookcn | 高 | - | |xhs | 38,406 | 8.6 GB | 网络 | 中 | - | |zyd2023 | 3,935 | 3.8 GB | 网络 | 中 | - | 仅供科学研究使用!

This dataset includes Chinese H novels from various sources, categorized into different types such as jjsw, pixiv-selected, shubao, etc. Each category has specific numbers of articles, size after decompression, source, and quality rating. The dataset is primarily intended for scientific research purposes.
提供机构:
a686d380
原始信息汇总

数据集概述

数据集详情

数据集名称 文章数 解压后大小 来源 质量 备注
jjsw 73,432 4.0 GB 禁忌书屋 -
pixiv-selected 2,935 174.3 MB pixiv排行版 -
shubao 6,776 1.6 GB 网络 -
sis-long 4,555 3.5 GB sis -
sis-short 111,237 4.1 GB sis -
xbookcn 39,798 1.0 GB xbookcn -
xhs 38,406 8.6 GB 网络 -
zyd2023 3,935 3.8 GB 网络 -

使用声明

  • 仅供科学研究使用!
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作