five

its5Q/resh-edu

收藏
Hugging Face2023-07-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/its5Q/resh-edu
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从resh.edu.ru网站上抓取的课程数据,包含7260个课程及其元数据、课程摘要和一些训练练习。数据集主要用于文本生成和问答任务,支持语言建模和开放域问答。数据集的语言主要是俄语,除非课程主题是外语(如中文、德语、英语等)。数据集的结构包括课程ID、格式、主题、标题、作者、年级、摘要和练习等字段。练习部分包含多种类型的问题,如单选、多选、填空题等。所有数据都存储在训练集分割中。数据集的创建是通过GitHub上的脚本完成的,且数据不受版权保护,可以自由使用和分发。

该数据集是从resh.edu.ru网站上抓取的课程数据,包含7260个课程及其元数据、课程摘要和一些训练练习。数据集主要用于文本生成和问答任务,支持语言建模和开放域问答。数据集的语言主要是俄语,除非课程主题是外语(如中文、德语、英语等)。数据集的结构包括课程ID、格式、主题、标题、作者、年级、摘要和练习等字段。练习部分包含多种类型的问题,如单选、多选、填空题等。所有数据都存储在训练集分割中。数据集的创建是通过GitHub上的脚本完成的,且数据不受版权保护,可以自由使用和分发。
提供机构:
its5Q
原始信息汇总

数据集概述

数据集名称

  • 名称:resh.edu.ru

数据集描述

  • 摘要:该数据集包含从resh.edu.ru网站抓取的7260节课程,包括课程的元数据、摘要和一些训练练习。
  • 语言:主要为俄语,部分课程涉及外语教学。

数据集结构

  • 数据字段

    • id (int):课程ID
    • format (string):课程格式(旧或新)
    • subject (string):课程所属科目
    • title (string):课程标题
    • author (string):课程作者(新课程中为空)
    • grade (int):课程年级
    • summary (string):课程摘要,HTML格式
    • excercises (list):课程练习列表,结构根据练习类型变化
  • 练习字段

    • id (int):练习ID
    • title (string):练习标题
    • question (string):问题,HTML格式
    • question_type (string):问题类型
  • 问题类型

    • single_choicemultiple_choice
    • text_entry
    • gap_match_text
    • gap_match_color
    • two_sets_association
    • inline_choice
    • order
    • gap_match_table

数据集创建

  • 来源:原始数据,通过脚本从resh.edu.ru抓取。

许可证

  • 许可证:cc0-1.0

任务类别

  • 任务类别
    • 文本生成
    • 问答

任务ID

  • 任务ID
    • 语言建模
    • 开放领域问答
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作