five

ysharma/short_jokes

收藏
Hugging Face2022-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ysharma/short_jokes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含231,657条短笑话的CSV文件,每条笑话的长度在10到200个字符之间。每条记录包含一个唯一的ID和笑话内容。数据集通过从多个包含短笑话的网站上抓取数据收集而成,旨在为机器学习模型提供丰富的幽默生成资源。尽管努力保持笑话的清洁,但由于数据是通过网络抓取收集的,可能存在一些不适当或冒犯性的内容。
提供机构:
ysharma
原始信息汇总

数据集概述

数据集内容

  • 文件格式:CSV
  • 数据量:包含231,657条笑话
  • 数据结构:每条记录包含一个唯一ID和对应的笑话
  • 笑话长度:10至200个字符

数据来源

  • 数据通过爬取多个包含短笑话的网站收集而成

许可证

  • 许可证类型:MIT

注意事项

  • 尽管已尽力确保笑话内容的清洁,但由于数据来源于网站爬取,可能存在少数不适宜或冒犯性的笑话
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作