five

RyokoAI_Syosetu711K

收藏
OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/RyokoAI_Syosetu711K?tab=summary
下载链接
链接失效反馈
官方服务:
资源简介:
Syosetu711K 仓库提供了一个包含约 71.17 万部日语小说的文本数据集,这些小说来源于“成为小说家吧”网站。该数据集主要用于文本生成模型的非监督训练,同时也支持文本分类等任务。数据集中每部小说都带有元数据,包括作者、标题、ID、小说长度、积分、质量评分、章节数、关键词、是否为 R15+ 作品、小说类型 ID 和通用小说类型 ID 等信息,方便用户进行筛选和评估。该数据集基于 Apache 2.0 协议发布。
提供机构:
AIWizards
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作