itisarainyday/ml_bert_clustering
收藏Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/itisarainyday/ml_bert_clustering
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如问题ID(questionid)、选择编号(RA_number)、选择内容(RA_choice)等,涵盖了问题的多个维度,包括内容、技能、持续时间等。数据集的训练集包含776个样本,总大小为5626861字节,下载大小为3730204字节。
This dataset contains multiple feature fields such as question ID (questionid), choice number (RA_number), choice content (RA_choice), etc., covering various dimensions of questions including content, skills, duration, etc. The training set of the dataset contains 776 samples, with a total size of 5626861 bytes and a download size of 3730204 bytes.
提供机构:
itisarainyday
原始信息汇总
数据集概述
数据集信息
特征
- questionid: 字符串类型
- RA_number: 64位整数类型
- RA_choice: 64位整数类型
- RA_none: 64位整数类型
- modulename: 64位整数类型
- setname: 字符串类型
- questiontitle: 字符串类型
- setnumber: 64位整数类型
- questionnumber: 64位整数类型
- masterContent: 字符串类型
- skill: 64位浮点数类型
- durationUpperBound: 64位浮点数类型
- partContent: 字符串类型
- partposition: 64位整数类型
- workedsolutionpos: 64位浮点数类型
- workedsolution: 字符串类型
- tutorial: 字符串类型
- total_topic: 字符串类型
- roundedDuration: 64位整数类型
- module: 64位整数类型
- level: 64位整数类型
- total_text: 字符串类型
- questionContent: 字符串类型
- question_sentence_len: 64位整数类型
- verb_count_q: 64位整数类型
- verb_count_sol: 64位整数类型
- text_len: 64位整数类型
- latex_len: 64位整数类型
- latex_len_solution: 64位整数类型
- latex_len_tutorial: 64位整数类型
- text_len_solution: 64位整数类型
- text_len_tutorial: 64位整数类型
- text_len_parts: 64位整数类型
- latex_len_parts: 64位整数类型
- text_len_question: 64位整数类型
- latex_len_question: 64位整数类型
- embeddings: 64位整数类型
- table: 64位整数类型
- total_sol_len: 64位整数类型
- steps: 64位浮点数类型
- parts_skills: 64位浮点数类型
- skill_x_total_sol_len: 64位浮点数类型
- skill_x_steps: 64位浮点数类型
- text_latex_stats: 64位整数类型
- solution_latex_stats: 64位整数类型
- RA_total: 64位整数类型
- char_len_question: 64位整数类型
数据分割
- train: 包含776个样本,占用5626861字节
数据集大小
- 下载大小: 3730204字节
- 数据集大小: 5626861字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



