five

LimYeri/leetcode_with_youtube_captions

收藏
Hugging Face2024-05-29 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/LimYeri/leetcode_with_youtube_captions
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en license: mit size_categories: - 10K<n<100K task_categories: - text-classification - text-generation pretty_name: Leetcode informations with youtube captions tags: - code dataset_info: features: - name: cc_content dtype: string - name: id dtype: int64 - name: thumbnail dtype: string - name: title dtype: string - name: question_content dtype: string - name: java dtype: string - name: c++ dtype: string - name: python dtype: string - name: javascript dtype: string - name: title_slug dtype: string - name: tag dtype: string - name: level dtype: string - name: success_rate dtype: float64 - name: total_submission dtype: float64 - name: total_accepted dtype: float64 - name: question_likes dtype: float64 - name: question_dislikes dtype: float64 - name: question_hints dtype: string - name: similar_question_ids dtype: string - name: num_tokens dtype: int64 splits: - name: train num_bytes: 576312572 num_examples: 18136 download_size: 150441753 dataset_size: 576312572 configs: - config_name: default data_files: - split: train path: data/train-* ---

language: - 英语(en) license: MIT许可证 size_categories: - 10000条 < 样本数 < 100000条 task_categories: - 文本分类 - 文本生成 pretty_name: 含YouTube字幕的力扣(LeetCode)信息数据集 tags: - 代码(code) dataset_info: features: - name: 字幕内容(cc_content) dtype: 字符串 - name: 编号(id) dtype: 整数 - name: 缩略图(thumbnail) dtype: 字符串 - name: 标题(title) dtype: 字符串 - name: 题目内容(question_content) dtype: 字符串 - name: Java代码(java) dtype: 字符串 - name: C++代码(c++) dtype: 字符串 - name: Python代码(python) dtype: 字符串 - name: JavaScript代码(javascript) dtype: 字符串 - name: 标题标识符(title_slug) dtype: 字符串 - name: 题目标签(tag) dtype: 字符串 - name: 难度等级(level) dtype: 字符串 - name: 通过率(success_rate) dtype: 浮点数 - name: 总提交次数(total_submission) dtype: 浮点数 - name: 总通过次数(total_accepted) dtype: 浮点数 - name: 题目点赞数(question_likes) dtype: 浮点数 - name: 题目点踩数(question_dislikes) dtype: 浮点数 - name: 题目提示(question_hints) dtype: 字符串 - name: 相似题目编号(similar_question_ids) dtype: 字符串 - name: Token数(num_tokens) dtype: 整数 splits: - name: 训练集(train) num_bytes: 576312572 字节 num_examples: 18136 download_size: 150441753 字节 dataset_size: 576312572 字节 configs: - config_name: 默认配置(default) data_files: - split: 训练集(train) path: data/train-*
提供机构:
LimYeri
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 许可证: MIT
  • 大小范围: 10K<n<100K
  • 任务类别:
    • 文本分类
    • 文本生成
  • 美观名称: Leetcode informations with youtube captions
  • 标签: 代码

数据集特征

  • cc_content: 字符串
  • id: 整数
  • thumbnail: 字符串
  • title: 字符串
  • question_content: 字符串
  • java: 字符串
  • c++: 字符串
  • python: 字符串
  • javascript: 字符串
  • title_slug: 字符串
  • tag: 字符串
  • level: 字符串
  • success_rate: 浮点数
  • total_submission: 浮点数
  • total_accepted: 浮点数
  • question_likes: 浮点数
  • question_dislikes: 浮点数
  • question_hints: 字符串
  • similar_question_ids: 字符串
  • num_tokens: 整数

数据分割

  • 训练集:
    • 字节数: 576312572
    • 示例数: 18136

下载与数据集大小

  • 下载大小: 150441753
  • 数据集大小: 576312572
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作