小学教材语料
收藏OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/ABear/Textbooks_Primary_School
下载链接
链接失效反馈官方服务:
资源简介:
教材-小学数据集包含了我国小学阶段学生常用的96册教材的多模态数据,包括图片与文本信息。
The Primary School Textbook Dataset contains multimodal data from 96 textbooks commonly used by primary school students in China, including image and text information.
提供机构:
ABear
创建时间:
2023-07-20
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个包含96册小学教材的多模态语料库,涵盖语文、数学、英语等七门科目,数据来自人教版和统编版教材,经过预处理和人工审核,适用于语言建模和文本生成任务。数据集以jsonl格式提供,包括文本和图片索引,支持多模态模型应用。
以上内容由遇见数据集搜集并总结生成



