RamAnanth1/lex-fridman-podcasts
收藏Hugging Face2022-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RamAnanth1/lex-fridman-podcasts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于Andrej Karpathy的Lexicap网站,包含Lex Fridman播客的英文转录。这些转录是使用OpenAI的大型Whisper模型生成的。数据集适用于文本分类、文本生成和摘要等任务,特别是情感分析、对话建模和语言建模。
---
lexicap:
- 现有采集
language:
- 英语(en)
language_creators:
- 现有采集
license: []
multilinguality:
- 单语言(monolingual)
pretty_name: '莱克斯·弗里德曼播客(Lex Fridman Podcasts)'
size_categories:
- 样本数少于1000(n<1K)
task_categories:
- 文本分类(text-classification)
- 文本生成(text-generation)
- 摘要生成(summarization)
task_ids:
- 情感分析(sentiment-analysis)
- 对话建模(dialogue-modeling)
- 语言建模(language-modeling)
---
# 莱克斯·弗里德曼播客数据集卡片
本数据集源自安德烈·卡帕西(Andrej Karpathy)的[Lexicap网站](https://karpathy.ai/lexicap/),该站点收录了莱克斯·弗里德曼播客各期节目的英文转录文本。转录文本通过OpenAI的大型[Whisper模型(Whisper model)](https://github.com/openai/whisper)生成。
提供机构:
RamAnanth1
原始信息汇总
数据集概述
基本信息
- 名称: Lex Fridman Podcasts
- 语言: 英语(en)
- 多语言性: 单语种
- 规模: 小于1千条数据
数据来源
- 来源: 由Andrej Karpathy的Lexicap网站提供
- 生成方式: 使用OpenAI的Whisper模型生成
许可信息
- 许可证: 未指定
数据集用途
- 任务类别:
- 文本分类
- 文本生成
- 摘要生成
- 具体任务:
- 情感分析
- 对话建模
- 语言建模



