Fraser/short-jokes
收藏Hugging Face2021-02-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Fraser/short-jokes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含231,657条短笑话的CSV文件,每条笑话的长度在10到200个字符之间。数据集通过抓取多个包含短笑话的网站收集而成,旨在为机器学习模型生成幽默提供支持。虽然已尽力保持笑话的清洁,但由于数据是通过抓取网站收集的,可能存在一些不适当或冒犯性的笑话。
This dataset is a CSV file containing 231,657 short jokes, with each joke ranging from 10 to 200 characters in length. It was collected by scraping multiple websites that host short jokes, and is intended to support humor generation for machine learning models. While every effort has been made to keep the jokes clean, since the data was gathered via web scraping, some inappropriate or offensive jokes may still be present.
提供机构:
Fraser
原始信息汇总
数据集概述
数据集来源
- 原始数据集来自Kaggle,链接为:Kaggle dataset。
数据集内容
- 数据集包含231,657条笑话。
- 笑话长度范围:10至200字符。
- 数据格式:CSV文件,每行包含一个唯一ID和一条笑话。
数据集用途
- 用于机器学习领域中幽默生成的研究,帮助模型理解笑话的深层语义意义。
数据集注意事项
- 数据通过网站抓取收集,可能包含少量不适当或冒犯性的内容。



