its5Q/resh-edu
收藏Hugging Face2023-07-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/its5Q/resh-edu
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从resh.edu.ru网站上抓取的课程数据,包含7260个课程及其元数据、课程摘要和一些训练练习。数据集主要用于文本生成和问答任务,支持语言建模和开放域问答。数据集的语言主要是俄语,除非课程主题是外语(如中文、德语、英语等)。数据集的结构包括课程ID、格式、主题、标题、作者、年级、摘要和练习等字段。练习部分包含多种类型的问题,如单选、多选、填空题等。所有数据都存储在训练集分割中。数据集的创建是通过GitHub上的脚本完成的,且数据不受版权保护,可以自由使用和分发。
该数据集是从resh.edu.ru网站上抓取的课程数据,包含7260个课程及其元数据、课程摘要和一些训练练习。数据集主要用于文本生成和问答任务,支持语言建模和开放域问答。数据集的语言主要是俄语,除非课程主题是外语(如中文、德语、英语等)。数据集的结构包括课程ID、格式、主题、标题、作者、年级、摘要和练习等字段。练习部分包含多种类型的问题,如单选、多选、填空题等。所有数据都存储在训练集分割中。数据集的创建是通过GitHub上的脚本完成的,且数据不受版权保护,可以自由使用和分发。
提供机构:
its5Q
原始信息汇总
数据集概述
数据集名称
- 名称:resh.edu.ru
数据集描述
- 摘要:该数据集包含从resh.edu.ru网站抓取的7260节课程,包括课程的元数据、摘要和一些训练练习。
- 语言:主要为俄语,部分课程涉及外语教学。
数据集结构
-
数据字段:
id(int):课程IDformat(string):课程格式(旧或新)subject(string):课程所属科目title(string):课程标题author(string):课程作者(新课程中为空)grade(int):课程年级summary(string):课程摘要,HTML格式excercises(list):课程练习列表,结构根据练习类型变化
-
练习字段:
id(int):练习IDtitle(string):练习标题question(string):问题,HTML格式question_type(string):问题类型
-
问题类型:
single_choice和multiple_choicetext_entrygap_match_textgap_match_colortwo_sets_associationinline_choiceordergap_match_table
数据集创建
- 来源:原始数据,通过脚本从resh.edu.ru抓取。
许可证
- 许可证:cc0-1.0
任务类别
- 任务类别:
- 文本生成
- 问答
任务ID
- 任务ID:
- 语言建模
- 开放领域问答



