BEE-spoke-data/sarcasm-scrolls
收藏Hugging Face2024-06-23 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/BEE-spoke-data/sarcasm-scrolls
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含各种讽刺媒体的段落分割音频转录。
提供机构:
BEE-spoke-data
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: odc-by
- 大小类别: 1K<n<10K
- 任务类别: 文本生成
数据集结构
特征
- section: 字符串类型
- filename: 字符串类型
- text: 字符串类型
分割
- train:
- 字节数: 31705529
- 样本数: 4937
文件大小
- 下载大小: 18588797
- 数据集大小: 31705529
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:
统计信息
- GPT-4 tiktoken 令牌计数:
- 总数: 7.38 M 令牌
- 统计数据:
- count: 4937.000000
- mean: 1495.166295
- std: 2787.318839
- min: 44.000000
- 25%: 419.000000
- 50%: 599.000000
- 75%: 955.000000
- max: 59143.000000



