five

HuggingFaceGECLM/REDDIT_threaded

收藏
Hugging Face2023-03-17 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/HuggingFaceGECLM/REDDIT_threaded
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: start_date dtype: string - name: end_date dtype: string - name: thread_id dtype: string - name: subreddit dtype: string - name: subreddit_id dtype: string - name: total_score dtype: int64 - name: text dtype: string - name: num_messages dtype: int64 - name: avg_score dtype: float64 splits: - name: tifu num_bytes: 454388196 num_examples: 208970 - name: Documentaries num_bytes: 93629662 num_examples: 54210 - name: explainlikeimfive num_bytes: 1046681120 num_examples: 652525 - name: WritingPrompts num_bytes: 845178305 num_examples: 211245 - name: changemyview num_bytes: 951562359 num_examples: 134667 - name: LifeProTips num_bytes: 270244448 num_examples: 237375 - name: todayilearned num_bytes: 922018228 num_examples: 667200 - name: science num_bytes: 293085684 num_examples: 153849 - name: askscience num_bytes: 485441735 num_examples: 212470 - name: ifyoulikeblank num_bytes: 79838466 num_examples: 84536 - name: Foodforthought num_bytes: 47246819 num_examples: 18475 - name: IWantToLearn num_bytes: 74180798 num_examples: 42927 - name: bestof num_bytes: 107926710 num_examples: 44408 - name: IAmA num_bytes: 387869949 num_examples: 177616 - name: socialskills num_bytes: 208582458 num_examples: 103156 - name: programming num_bytes: 350054262 num_examples: 168154 - name: gardening num_bytes: 349336406 num_examples: 365384 - name: Damnthatsinteresting num_bytes: 153439357 num_examples: 166914 - name: lifehacks num_bytes: 33642034 num_examples: 36265 - name: travel num_bytes: 354429861 num_examples: 204434 - name: relationship_advice num_bytes: 3779011482 num_examples: 1553725 - name: philosophy num_bytes: 206723923 num_examples: 44796 - name: Fitness num_bytes: 666442392 num_examples: 371800 - name: YouShouldKnow num_bytes: 57320879 num_examples: 30239 - name: history num_bytes: 130094622 num_examples: 53636 - name: books num_bytes: 324225643 num_examples: 179976 - name: technology num_bytes: 418616319 num_examples: 225749 - name: UpliftingNews num_bytes: 68698295 num_examples: 39274 - name: GetMotivated num_bytes: 75648561 num_examples: 52652 - name: gadgets num_bytes: 55725657 num_examples: 33467 - name: space num_bytes: 186780078 num_examples: 117530 - name: sports num_bytes: 92005983 num_examples: 79903 - name: Showerthoughts num_bytes: 842958842 num_examples: 1337755 - name: personalfinance num_bytes: 1855551236 num_examples: 847951 - name: buildapc num_bytes: 4208530709 num_examples: 1892762 - name: EatCheapAndHealthy num_bytes: 65934639 num_examples: 38706 - name: boardgames num_bytes: 398914878 num_examples: 191826 - name: malefashionadvice num_bytes: 335564558 num_examples: 231363 - name: femalefashionadvice num_bytes: 114962358 num_examples: 49612 - name: scifi num_bytes: 86198725 num_examples: 50268 - name: Fantasy num_bytes: 288057115 num_examples: 116359 - name: Games num_bytes: 540015295 num_examples: 211345 - name: bodyweightfitness num_bytes: 146251112 num_examples: 74165 - name: SkincareAddiction num_bytes: 518704351 num_examples: 288116 - name: podcasts num_bytes: 62920098 num_examples: 46116 - name: suggestmeabook num_bytes: 244723416 num_examples: 174635 - name: AskHistorians num_bytes: 638056364 num_examples: 151306 - name: mildlyinteresting num_bytes: 419997082 num_examples: 782806 - name: DIY num_bytes: 218417925 num_examples: 149760 - name: gaming num_bytes: 1760077944 num_examples: 1838783 download_size: 15593798957 dataset_size: 26315907338 --- # Dataset Card for "REDDIT_threaded" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
HuggingFaceGECLM
原始信息汇总

数据集概述

数据集名称

"REDDIT_threaded"

数据集特征

  • start_date: 数据类型为字符串。
  • end_date: 数据类型为字符串。
  • thread_id: 数据类型为字符串。
  • subreddit: 数据类型为字符串。
  • subreddit_id: 数据类型为字符串。
  • total_score: 数据类型为int64。
  • text: 数据类型为字符串。
  • num_messages: 数据类型为int64。
  • avg_score: 数据类型为float64。

数据集分割

  • tifu: 大小为454388196字节,包含208970个示例。
  • Documentaries: 大小为93629662字节,包含54210个示例。
  • explainlikeimfive: 大小为1046681120字节,包含652525个示例。
  • WritingPrompts: 大小为845178305字节,包含211245个示例。
  • changemyview: 大小为951562359字节,包含134667个示例。
  • LifeProTips: 大小为270244448字节,包含237375个示例。
  • todayilearned: 大小为922018228字节,包含667200个示例。
  • science: 大小为293085684字节,包含153849个示例。
  • askscience: 大小为485441735字节,包含212470个示例。
  • ifyoulikeblank: 大小为79838466字节,包含84536个示例。
  • Foodforthought: 大小为47246819字节,包含18475个示例。
  • IWantToLearn: 大小为74180798字节,包含42927个示例。
  • bestof: 大小为107926710字节,包含44408个示例。
  • IAmA: 大小为387869949字节,包含177616个示例。
  • socialskills: 大小为208582458字节,包含103156个示例。
  • programming: 大小为350054262字节,包含168154个示例。
  • gardening: 大小为349336406字节,包含365384个示例。
  • Damnthatsinteresting: 大小为153439357字节,包含166914个示例。
  • lifehacks: 大小为33642034字节,包含36265个示例。
  • travel: 大小为354429861字节,包含204434个示例。
  • relationship_advice: 大小为3779011482字节,包含1553725个示例。
  • philosophy: 大小为206723923字节,包含44796个示例。
  • Fitness: 大小为666442392字节,包含371800个示例。
  • YouShouldKnow: 大小为57320879字节,包含30239个示例。
  • history: 大小为130094622字节,包含53636个示例。
  • books: 大小为324225643字节,包含179976个示例。
  • technology: 大小为418616319字节,包含225749个示例。
  • UpliftingNews: 大小为68698295字节,包含39274个示例。
  • GetMotivated: 大小为75648561字节,包含52652个示例。
  • gadgets: 大小为55725657字节,包含33467个示例。
  • space: 大小为186780078字节,包含117530个示例。
  • sports: 大小为92005983字节,包含79903个示例。
  • Showerthoughts: 大小为842958842字节,包含1337755个示例。
  • personalfinance: 大小为1855551236字节,包含847951个示例。
  • buildapc: 大小为4208530709字节,包含1892762个示例。
  • EatCheapAndHealthy: 大小为65934639字节,包含38706个示例。
  • boardgames: 大小为398914878字节,包含191826个示例。
  • malefashionadvice: 大小为335564558字节,包含231363个示例。
  • femalefashionadvice: 大小为114962358字节,包含49612个示例。
  • scifi: 大小为86198725字节,包含50268个示例。
  • Fantasy: 大小为288057115字节,包含116359个示例。
  • Games: 大小为540015295字节,包含211345个示例。
  • bodyweightfitness: 大小为146251112字节,包含74165个示例。
  • SkincareAddiction: 大小为518704351字节,包含288116个示例。
  • podcasts: 大小为62920098字节,包含46116个示例。
  • suggestmeabook: 大小为244723416字节,包含174635个示例。
  • AskHistorians: 大小为638056364字节,包含151306个示例。
  • mildlyinteresting: 大小为419997082字节,包含782806个示例。
  • DIY: 大小为218417925字节,包含149760个示例。
  • gaming: 大小为1760077944字节,包含1838783个示例。

数据集大小

  • 下载大小: 15593798957字节。
  • 数据集总大小: 26315907338字节。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作