five

Taranosaurus/bash-org-archive.com

收藏
Hugging Face2024-04-14 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Taranosaurus/bash-org-archive.com
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个非官方的Bash.org网站镜像存档数据集。Bash.org是一个于1999年推出的网站,致力于存档多年来来自IRC和其他聊天平台的有趣引用。该数据集提供了对当时常见的笑话、梗和不当内容的一瞥。数据集经过自定义解析器清理,以保留内容的原始格式。数据集包含三个字段:qid(引用ID)、score(评分)和quote(引用)。

这是一个非官方的Bash.org网站镜像存档数据集。Bash.org是一个于1999年推出的网站,致力于存档多年来来自IRC和其他聊天平台的有趣引用。该数据集提供了对当时常见的笑话、梗和不当内容的一瞥。数据集经过自定义解析器清理,以保留内容的原始格式。数据集包含三个字段:qid(引用ID)、score(评分)和quote(引用)。
提供机构:
Taranosaurus
原始信息汇总

数据集概述

基本信息

  • 许可证: unknown
  • 任务类别: text-generation
  • 语言: en
  • 标签: bash.org, irc, chat-archive
  • 名称: Bash.org Archive
  • 大小: 10K<n<100K

数据集详情

  • 特征:
    • qid: 字符串类型
    • score: 字符串类型
    • quote: 字符串类型
  • 分割:
    • train: 3548502 字节, 21092 条记录
  • 下载大小: 3548502 字节
  • 数据集大小: 21092 条记录

数据集内容

  • 列信息:
    • qid: Quote ID
    • score: Score
    • quote: Quote

示例

  • Quote ID: #54588
  • Score: 517
  • Quote: 包含多个用户的对话,涉及飞行相关的幽默内容。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作