five

nmcco/BOOKv3_instruction_combined_balanced_5books

收藏
Hugging Face2025-03-31 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/nmcco/BOOKv3_instruction_combined_balanced_5books
下载链接
链接失效反馈
官方服务:
资源简介:
BOOKv3_instruction_combined_balanced_5books数据集包含了从书籍中提取的文本数据,这些数据被平衡地结合了5本书的内容。数据集分为训练集和测试集,具有多个特征,包括文本的completion和prompt、测试文本、发言人信息等。训练集包含8207个示例,大小为118MB,而测试集包含2145个示例,大小为28MB。

The BOOKv3_instruction_combined_balanced_5books dataset consists of text extracted from books, combined with content balanced across 5 books. The dataset is split into training and test sets, and it features multiple attributes including text completion and prompt, test text, speaker information, and more. The training set contains 8207 examples and is 118MB in size, while the test set contains 2145 examples and is 28MB in size.
提供机构:
nmcco
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作