itisarainyday/ml_bert_training
收藏Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/itisarainyday/ml_bert_training
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,涉及问题的ID、答案选择、模块名称、模块、级别、集合编号、问题编号、主要内容、部分内容、部分位置、技能、四舍五入的持续时间、教程、工作解决方案、总文本、文本长度、LaTeX长度、LaTeX解决方案长度、LaTeX教程长度、文本解决方案长度、文本教程长度、文本部分长度、LaTeX部分长度、嵌入、问题内容、问题句子长度等。数据集包含一个训练集分割,包含724个样本,总大小为4787009字节,下载大小为3154959字节。
The dataset includes multiple fields such as question ID, answer choices, module name, module, level, set number, question number, main content, part content, part position, skill, rounded duration, tutorial, worked solution, total text, text length, LaTeX length, LaTeX solution length, LaTeX tutorial length, text solution length, text tutorial length, text parts length, LaTeX parts length, embeddings, question content, and question sentence length. The dataset contains a training split with 724 samples, a total size of 4787009 bytes, and a download size of 3154959 bytes.
提供机构:
itisarainyday
原始信息汇总
数据集概述
数据集信息
特征
- questionid: 字符串类型
- RA_number: 整数类型
- RA_choice: 整数类型
- RA_none: 整数类型
- modulename: 整数类型
- module: 整数类型
- level: 整数类型
- setnumber: 整数类型
- questionnumber: 整数类型
- masterContent: 字符串类型
- partContent: 字符串类型
- partposition: 整数类型
- skill: 浮点数类型
- roundedDuration: 整数类型
- tutorial: 字符串类型
- workedsolution: 字符串类型
- total_text: 字符串类型
- text_len: 整数类型
- latex_len: 整数类型
- latex_len_solution: 整数类型
- latex_len_tutorial: 整数类型
- text_len_solution: 整数类型
- text_len_tutorial: 整数类型
- text_len_parts: 整数类型
- latex_len_parts: 整数类型
- embeddings: 整数类型
- questionContent: 字符串类型
- question_sentence_len: 整数类型
数据分割
- train: 包含724个样本,占用4787009字节
数据集大小
- 下载大小: 3154959字节
- 数据集大小: 4787009字节
配置
- default: 包含训练数据文件,路径为
data/train-*



