five

lemonilia/roleplaying-forums-raw

收藏
Hugging Face2025-01-11 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/lemonilia/roleplaying-forums-raw
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含角色扮演论坛原始数据的集合,数据以HTML字符串和元数据形式存储,每个帖子占据一行。数据集包含了大小在100K到1M之间的NSFW(成人内容)和SFW(安全内容)论坛。数据来源于多个论坛,抓取时使用了特定的策略,但需要进一步处理才能适用于微调。数据集还包含了角色内(IC)和角色外(OOC)的帖子。

This is a collection of raw roleplaying forum data, stored as HTML strings and metadata with one row per post. The dataset includes NSFW (adult content) and SFW (safe content) forums ranging in size from 100K to 1M. The data is sourced from multiple forums, scraped using specific strategies, but requires further processing for fine-tuning. The dataset also includes in-character (IC) and out-of-character (OOC) posts.
提供机构:
lemonilia
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作