five

RamAnanth1/lex-fridman-podcasts

收藏
Hugging Face2022-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RamAnanth1/lex-fridman-podcasts
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来源于Andrej Karpathy的Lexicap网站,包含Lex Fridman播客的英文转录。这些转录是使用OpenAI的大型Whisper模型生成的。数据集适用于文本分类、文本生成和摘要等任务,特别是情感分析、对话建模和语言建模。

--- lexicap: - 现有采集 language: - 英语(en) language_creators: - 现有采集 license: [] multilinguality: - 单语言(monolingual) pretty_name: '莱克斯·弗里德曼播客(Lex Fridman Podcasts)' size_categories: - 样本数少于1000(n<1K) task_categories: - 文本分类(text-classification) - 文本生成(text-generation) - 摘要生成(summarization) task_ids: - 情感分析(sentiment-analysis) - 对话建模(dialogue-modeling) - 语言建模(language-modeling) --- # 莱克斯·弗里德曼播客数据集卡片 本数据集源自安德烈·卡帕西(Andrej Karpathy)的[Lexicap网站](https://karpathy.ai/lexicap/),该站点收录了莱克斯·弗里德曼播客各期节目的英文转录文本。转录文本通过OpenAI的大型[Whisper模型(Whisper model)](https://github.com/openai/whisper)生成。
提供机构:
RamAnanth1
原始信息汇总

数据集概述

基本信息

  • 名称: Lex Fridman Podcasts
  • 语言: 英语(en)
  • 多语言性: 单语种
  • 规模: 小于1千条数据

数据来源

  • 来源: 由Andrej Karpathy的Lexicap网站提供
  • 生成方式: 使用OpenAI的Whisper模型生成

许可信息

  • 许可证: 未指定

数据集用途

  • 任务类别:
    • 文本分类
    • 文本生成
    • 摘要生成
  • 具体任务:
    • 情感分析
    • 对话建模
    • 语言建模
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作