five

krplt/spongebob_transcripts

收藏
Hugging Face2023-03-23 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/krplt/spongebob_transcripts
下载链接
链接失效反馈
官方服务:
资源简介:
Spongebob Transcripts数据集是一个收集了动画电视剧《海绵宝宝》对话文本的数据集。该数据集包含了每个角色所说的每一行对话,包括角色名称、对话内容和集数ID。数据集还提供了系统对话的描述,用于说明每集中的动作和事件。数据集包含84个角色,约80,800个单词,约4000行数据,并更新至第一季全集。

Spongebob Transcripts数据集是一个收集了动画电视剧《海绵宝宝》对话文本的数据集。该数据集包含了每个角色所说的每一行对话,包括角色名称、对话内容和集数ID。数据集还提供了系统对话的描述,用于说明每集中的动作和事件。数据集包含84个角色,约80,800个单词,约4000行数据,并更新至第一季全集。
提供机构:
krplt
原始信息汇总

Spongebob Transcripts Dataset 🧽

数据集概述

  • 类型: 文本生成, 对话
  • 语言: 英语
  • 规模: 10,000 < n < 100,000
  • 标签: 卡通
  • 许可: cc-by-sa-4.0

数据集内容

  • 角色数量: 84
  • 总字数: 约80,800字
  • 行数: 约4000行
  • 更新内容: 完整的第一季

数据集结构

列名 描述
Speaker 说话的角色
Replica 对话内容
EP_ID 剧集ID

系统描述

  • 描述格式: 使用括号表示动作和事件

示例数据

Speaker Replica EP_ID
Spongebob I just met this girl. She wears a hat full of... air. s1e3_22
Patrick Do you mean she puts on "airs"? s1e3_23
Spongebob I guess so. s1e3_24
Patrick Thats just fancy talk. If you wanna be fancy, hold your pinky up like this. The higher you hold it, the fancier you are. s1e3_25

数据集用途

  • 用于自然语言处理任务,如对话生成
  • 用于教育目的,如研究不同角色的语言和沟通风格
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作