five

jganzabalseenka/noun_phrases_2024-05-01_2024-05-30_total_668862

收藏
Hugging Face2024-07-01 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/jganzabalseenka/noun_phrases_2024-05-01_2024-05-30_total_668862
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含名词短语及其出现次数的记录。数据集分为一个训练集,包含668,862个示例,每个示例包含一个名词短语和对应的计数。数据集的总大小为20,517,594字节,下载大小为9,181,732字节。

This dataset contains records of noun phrases and their occurrence counts. The dataset is divided into a training set containing 668,862 examples, each consisting of a noun phrase and its corresponding count. The total size of the dataset is 20,517,594 bytes, with a download size of 9,181,732 bytes.
提供机构:
jganzabalseenka
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • noun_phrase: 类型为字符串 (string)
    • count: 类型为整数 (int64)

数据分割

  • 训练集 (train):
    • 文件大小: 20,517,594 字节
    • 样本数量: 668,862 个

数据集大小

  • 下载大小: 9,181,732 字节
  • 总数据集大小: 20,517,594 字节

配置

  • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*
二维码
社区交流群
二维码
科研交流群
商业服务