aaronday3/entirety_of_reddit
收藏Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/aaronday3/entirety_of_reddit
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个2.7TB大小的torrent文件,包含了2005年至2023年间的Reddit数据。这些数据对于大型语言模型(LLM)研究以及潜在的语言数据模型(LDM)研究具有重要价值。
该数据集是一个2.7TB大小的torrent文件,包含了2005年至2023年间的Reddit数据。这些数据对于大型语言模型(LLM)研究以及潜在的语言数据模型(LDM)研究具有重要价值。
提供机构:
aaronday3
原始信息汇总
数据集概述
任务类别
- 文本生成
数据规模
- 2.7TB
数据来源
时间范围
- 2005年至2023年
适用研究领域
- 大型语言模型(LLM)研究
- 潜在扩散模型(LDM)研究



