ysharma/short_jokes
收藏Hugging Face2022-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ysharma/short_jokes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含231,657条短笑话的CSV文件,每条笑话的长度在10到200个字符之间。每条记录包含一个唯一的ID和笑话内容。数据集通过从多个包含短笑话的网站上抓取数据收集而成,旨在为机器学习模型提供丰富的幽默生成资源。尽管努力保持笑话的清洁,但由于数据是通过网络抓取收集的,可能存在一些不适当或冒犯性的内容。
提供机构:
ysharma
原始信息汇总
数据集概述
数据集内容
- 文件格式:CSV
- 数据量:包含231,657条笑话
- 数据结构:每条记录包含一个唯一ID和对应的笑话
- 笑话长度:10至200个字符
数据来源
- 数据通过爬取多个包含短笑话的网站收集而成
许可证
- 许可证类型:MIT
注意事项
- 尽管已尽力确保笑话内容的清洁,但由于数据来源于网站爬取,可能存在少数不适宜或冒犯性的笑话



