HuggingFaceGECLM/REDDIT_threaded
收藏Hugging Face2023-03-17 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/HuggingFaceGECLM/REDDIT_threaded
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: start_date
dtype: string
- name: end_date
dtype: string
- name: thread_id
dtype: string
- name: subreddit
dtype: string
- name: subreddit_id
dtype: string
- name: total_score
dtype: int64
- name: text
dtype: string
- name: num_messages
dtype: int64
- name: avg_score
dtype: float64
splits:
- name: tifu
num_bytes: 454388196
num_examples: 208970
- name: Documentaries
num_bytes: 93629662
num_examples: 54210
- name: explainlikeimfive
num_bytes: 1046681120
num_examples: 652525
- name: WritingPrompts
num_bytes: 845178305
num_examples: 211245
- name: changemyview
num_bytes: 951562359
num_examples: 134667
- name: LifeProTips
num_bytes: 270244448
num_examples: 237375
- name: todayilearned
num_bytes: 922018228
num_examples: 667200
- name: science
num_bytes: 293085684
num_examples: 153849
- name: askscience
num_bytes: 485441735
num_examples: 212470
- name: ifyoulikeblank
num_bytes: 79838466
num_examples: 84536
- name: Foodforthought
num_bytes: 47246819
num_examples: 18475
- name: IWantToLearn
num_bytes: 74180798
num_examples: 42927
- name: bestof
num_bytes: 107926710
num_examples: 44408
- name: IAmA
num_bytes: 387869949
num_examples: 177616
- name: socialskills
num_bytes: 208582458
num_examples: 103156
- name: programming
num_bytes: 350054262
num_examples: 168154
- name: gardening
num_bytes: 349336406
num_examples: 365384
- name: Damnthatsinteresting
num_bytes: 153439357
num_examples: 166914
- name: lifehacks
num_bytes: 33642034
num_examples: 36265
- name: travel
num_bytes: 354429861
num_examples: 204434
- name: relationship_advice
num_bytes: 3779011482
num_examples: 1553725
- name: philosophy
num_bytes: 206723923
num_examples: 44796
- name: Fitness
num_bytes: 666442392
num_examples: 371800
- name: YouShouldKnow
num_bytes: 57320879
num_examples: 30239
- name: history
num_bytes: 130094622
num_examples: 53636
- name: books
num_bytes: 324225643
num_examples: 179976
- name: technology
num_bytes: 418616319
num_examples: 225749
- name: UpliftingNews
num_bytes: 68698295
num_examples: 39274
- name: GetMotivated
num_bytes: 75648561
num_examples: 52652
- name: gadgets
num_bytes: 55725657
num_examples: 33467
- name: space
num_bytes: 186780078
num_examples: 117530
- name: sports
num_bytes: 92005983
num_examples: 79903
- name: Showerthoughts
num_bytes: 842958842
num_examples: 1337755
- name: personalfinance
num_bytes: 1855551236
num_examples: 847951
- name: buildapc
num_bytes: 4208530709
num_examples: 1892762
- name: EatCheapAndHealthy
num_bytes: 65934639
num_examples: 38706
- name: boardgames
num_bytes: 398914878
num_examples: 191826
- name: malefashionadvice
num_bytes: 335564558
num_examples: 231363
- name: femalefashionadvice
num_bytes: 114962358
num_examples: 49612
- name: scifi
num_bytes: 86198725
num_examples: 50268
- name: Fantasy
num_bytes: 288057115
num_examples: 116359
- name: Games
num_bytes: 540015295
num_examples: 211345
- name: bodyweightfitness
num_bytes: 146251112
num_examples: 74165
- name: SkincareAddiction
num_bytes: 518704351
num_examples: 288116
- name: podcasts
num_bytes: 62920098
num_examples: 46116
- name: suggestmeabook
num_bytes: 244723416
num_examples: 174635
- name: AskHistorians
num_bytes: 638056364
num_examples: 151306
- name: mildlyinteresting
num_bytes: 419997082
num_examples: 782806
- name: DIY
num_bytes: 218417925
num_examples: 149760
- name: gaming
num_bytes: 1760077944
num_examples: 1838783
download_size: 15593798957
dataset_size: 26315907338
---
# Dataset Card for "REDDIT_threaded"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
HuggingFaceGECLM
原始信息汇总
数据集概述
数据集名称
"REDDIT_threaded"
数据集特征
- start_date: 数据类型为字符串。
- end_date: 数据类型为字符串。
- thread_id: 数据类型为字符串。
- subreddit: 数据类型为字符串。
- subreddit_id: 数据类型为字符串。
- total_score: 数据类型为int64。
- text: 数据类型为字符串。
- num_messages: 数据类型为int64。
- avg_score: 数据类型为float64。
数据集分割
- tifu: 大小为454388196字节,包含208970个示例。
- Documentaries: 大小为93629662字节,包含54210个示例。
- explainlikeimfive: 大小为1046681120字节,包含652525个示例。
- WritingPrompts: 大小为845178305字节,包含211245个示例。
- changemyview: 大小为951562359字节,包含134667个示例。
- LifeProTips: 大小为270244448字节,包含237375个示例。
- todayilearned: 大小为922018228字节,包含667200个示例。
- science: 大小为293085684字节,包含153849个示例。
- askscience: 大小为485441735字节,包含212470个示例。
- ifyoulikeblank: 大小为79838466字节,包含84536个示例。
- Foodforthought: 大小为47246819字节,包含18475个示例。
- IWantToLearn: 大小为74180798字节,包含42927个示例。
- bestof: 大小为107926710字节,包含44408个示例。
- IAmA: 大小为387869949字节,包含177616个示例。
- socialskills: 大小为208582458字节,包含103156个示例。
- programming: 大小为350054262字节,包含168154个示例。
- gardening: 大小为349336406字节,包含365384个示例。
- Damnthatsinteresting: 大小为153439357字节,包含166914个示例。
- lifehacks: 大小为33642034字节,包含36265个示例。
- travel: 大小为354429861字节,包含204434个示例。
- relationship_advice: 大小为3779011482字节,包含1553725个示例。
- philosophy: 大小为206723923字节,包含44796个示例。
- Fitness: 大小为666442392字节,包含371800个示例。
- YouShouldKnow: 大小为57320879字节,包含30239个示例。
- history: 大小为130094622字节,包含53636个示例。
- books: 大小为324225643字节,包含179976个示例。
- technology: 大小为418616319字节,包含225749个示例。
- UpliftingNews: 大小为68698295字节,包含39274个示例。
- GetMotivated: 大小为75648561字节,包含52652个示例。
- gadgets: 大小为55725657字节,包含33467个示例。
- space: 大小为186780078字节,包含117530个示例。
- sports: 大小为92005983字节,包含79903个示例。
- Showerthoughts: 大小为842958842字节,包含1337755个示例。
- personalfinance: 大小为1855551236字节,包含847951个示例。
- buildapc: 大小为4208530709字节,包含1892762个示例。
- EatCheapAndHealthy: 大小为65934639字节,包含38706个示例。
- boardgames: 大小为398914878字节,包含191826个示例。
- malefashionadvice: 大小为335564558字节,包含231363个示例。
- femalefashionadvice: 大小为114962358字节,包含49612个示例。
- scifi: 大小为86198725字节,包含50268个示例。
- Fantasy: 大小为288057115字节,包含116359个示例。
- Games: 大小为540015295字节,包含211345个示例。
- bodyweightfitness: 大小为146251112字节,包含74165个示例。
- SkincareAddiction: 大小为518704351字节,包含288116个示例。
- podcasts: 大小为62920098字节,包含46116个示例。
- suggestmeabook: 大小为244723416字节,包含174635个示例。
- AskHistorians: 大小为638056364字节,包含151306个示例。
- mildlyinteresting: 大小为419997082字节,包含782806个示例。
- DIY: 大小为218417925字节,包含149760个示例。
- gaming: 大小为1760077944字节,包含1838783个示例。
数据集大小
- 下载大小: 15593798957字节。
- 数据集总大小: 26315907338字节。



