kinianlo/wiki_20220301_en_nltk_uncased_phrases_clean
收藏Hugging Face2023-10-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kinianlo/wiki_20220301_en_nltk_uncased_phrases_clean
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: phrase_id
dtype: uint32
- name: adj_id
dtype: uint32
- name: noun_id
dtype: uint32
- name: count
dtype: uint64
splits:
- name: train
num_bytes: 67986800
num_examples: 3399340
download_size: 41983842
dataset_size: 67986800
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for "wiki_20220301_en_nltk_uncased_phrases_clean"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
kinianlo
原始信息汇总
数据集概述
数据集信息
- 特征:
phrase_id: 数据类型为uint32adj_id: 数据类型为uint32noun_id: 数据类型为uint32count: 数据类型为uint64
- 分割:
train: 包含 3399340 个样本,占用 67986800 字节
数据集大小
- 下载大小: 41983842 字节
- 数据集大小: 67986800 字节
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:



