five

itisarainyday/ml_bert_clustering

收藏
Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/itisarainyday/ml_bert_clustering
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征字段,如问题ID(questionid)、选择编号(RA_number)、选择内容(RA_choice)等,涵盖了问题的多个维度,包括内容、技能、持续时间等。数据集的训练集包含776个样本,总大小为5626861字节,下载大小为3730204字节。

This dataset contains multiple feature fields such as question ID (questionid), choice number (RA_number), choice content (RA_choice), etc., covering various dimensions of questions including content, skills, duration, etc. The training set of the dataset contains 776 samples, with a total size of 5626861 bytes and a download size of 3730204 bytes.
提供机构:
itisarainyday
原始信息汇总

数据集概述

数据集信息

特征

  • questionid: 字符串类型
  • RA_number: 64位整数类型
  • RA_choice: 64位整数类型
  • RA_none: 64位整数类型
  • modulename: 64位整数类型
  • setname: 字符串类型
  • questiontitle: 字符串类型
  • setnumber: 64位整数类型
  • questionnumber: 64位整数类型
  • masterContent: 字符串类型
  • skill: 64位浮点数类型
  • durationUpperBound: 64位浮点数类型
  • partContent: 字符串类型
  • partposition: 64位整数类型
  • workedsolutionpos: 64位浮点数类型
  • workedsolution: 字符串类型
  • tutorial: 字符串类型
  • total_topic: 字符串类型
  • roundedDuration: 64位整数类型
  • module: 64位整数类型
  • level: 64位整数类型
  • total_text: 字符串类型
  • questionContent: 字符串类型
  • question_sentence_len: 64位整数类型
  • verb_count_q: 64位整数类型
  • verb_count_sol: 64位整数类型
  • text_len: 64位整数类型
  • latex_len: 64位整数类型
  • latex_len_solution: 64位整数类型
  • latex_len_tutorial: 64位整数类型
  • text_len_solution: 64位整数类型
  • text_len_tutorial: 64位整数类型
  • text_len_parts: 64位整数类型
  • latex_len_parts: 64位整数类型
  • text_len_question: 64位整数类型
  • latex_len_question: 64位整数类型
  • embeddings: 64位整数类型
  • table: 64位整数类型
  • total_sol_len: 64位整数类型
  • steps: 64位浮点数类型
  • parts_skills: 64位浮点数类型
  • skill_x_total_sol_len: 64位浮点数类型
  • skill_x_steps: 64位浮点数类型
  • text_latex_stats: 64位整数类型
  • solution_latex_stats: 64位整数类型
  • RA_total: 64位整数类型
  • char_len_question: 64位整数类型

数据分割

  • train: 包含776个样本,占用5626861字节

数据集大小

  • 下载大小: 3730204字节
  • 数据集大小: 5626861字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作