LimYeri/leetcode_with_youtube_captions
收藏Hugging Face2024-05-29 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/LimYeri/leetcode_with_youtube_captions
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
license: mit
size_categories:
- 10K<n<100K
task_categories:
- text-classification
- text-generation
pretty_name: Leetcode informations with youtube captions
tags:
- code
dataset_info:
features:
- name: cc_content
dtype: string
- name: id
dtype: int64
- name: thumbnail
dtype: string
- name: title
dtype: string
- name: question_content
dtype: string
- name: java
dtype: string
- name: c++
dtype: string
- name: python
dtype: string
- name: javascript
dtype: string
- name: title_slug
dtype: string
- name: tag
dtype: string
- name: level
dtype: string
- name: success_rate
dtype: float64
- name: total_submission
dtype: float64
- name: total_accepted
dtype: float64
- name: question_likes
dtype: float64
- name: question_dislikes
dtype: float64
- name: question_hints
dtype: string
- name: similar_question_ids
dtype: string
- name: num_tokens
dtype: int64
splits:
- name: train
num_bytes: 576312572
num_examples: 18136
download_size: 150441753
dataset_size: 576312572
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
language:
- 英语(en)
license: MIT许可证
size_categories:
- 10000条 < 样本数 < 100000条
task_categories:
- 文本分类
- 文本生成
pretty_name: 含YouTube字幕的力扣(LeetCode)信息数据集
tags:
- 代码(code)
dataset_info:
features:
- name: 字幕内容(cc_content)
dtype: 字符串
- name: 编号(id)
dtype: 整数
- name: 缩略图(thumbnail)
dtype: 字符串
- name: 标题(title)
dtype: 字符串
- name: 题目内容(question_content)
dtype: 字符串
- name: Java代码(java)
dtype: 字符串
- name: C++代码(c++)
dtype: 字符串
- name: Python代码(python)
dtype: 字符串
- name: JavaScript代码(javascript)
dtype: 字符串
- name: 标题标识符(title_slug)
dtype: 字符串
- name: 题目标签(tag)
dtype: 字符串
- name: 难度等级(level)
dtype: 字符串
- name: 通过率(success_rate)
dtype: 浮点数
- name: 总提交次数(total_submission)
dtype: 浮点数
- name: 总通过次数(total_accepted)
dtype: 浮点数
- name: 题目点赞数(question_likes)
dtype: 浮点数
- name: 题目点踩数(question_dislikes)
dtype: 浮点数
- name: 题目提示(question_hints)
dtype: 字符串
- name: 相似题目编号(similar_question_ids)
dtype: 字符串
- name: Token数(num_tokens)
dtype: 整数
splits:
- name: 训练集(train)
num_bytes: 576312572 字节
num_examples: 18136
download_size: 150441753 字节
dataset_size: 576312572 字节
configs:
- config_name: 默认配置(default)
data_files:
- split: 训练集(train)
path: data/train-*
提供机构:
LimYeri
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: MIT
- 大小范围: 10K<n<100K
- 任务类别:
- 文本分类
- 文本生成
- 美观名称: Leetcode informations with youtube captions
- 标签: 代码
数据集特征
- cc_content: 字符串
- id: 整数
- thumbnail: 字符串
- title: 字符串
- question_content: 字符串
- java: 字符串
- c++: 字符串
- python: 字符串
- javascript: 字符串
- title_slug: 字符串
- tag: 字符串
- level: 字符串
- success_rate: 浮点数
- total_submission: 浮点数
- total_accepted: 浮点数
- question_likes: 浮点数
- question_dislikes: 浮点数
- question_hints: 字符串
- similar_question_ids: 字符串
- num_tokens: 整数
数据分割
- 训练集:
- 字节数: 576312572
- 示例数: 18136
下载与数据集大小
- 下载大小: 150441753
- 数据集大小: 576312572



