Confirm-Labs/pile_bigrams
收藏Hugging Face2023-06-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Confirm-Labs/pile_bigrams
下载链接
链接失效反馈官方服务:
资源简介:
# bigrams
See https://confirmlabs.org/posts/catalog.html for details.
- `id0`: the first token in the bigram
- `id1`: the second token in the bigram
- `count`: the number of times the bigram appears in The Pile.
提供机构:
Confirm-Labs
原始信息汇总
数据集概述:bigrams
数据集结构
- id0: 二元组中的第一个词。
- id1: 二元组中的第二个词。
- count: 二元组在《The Pile》中出现的次数。



