five

hyperdemocracy/usc-nomic-no-meta-chunks-v1-s2048-o256

收藏
Hugging Face2024-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hyperdemocracy/usc-nomic-no-meta-chunks-v1-s2048-o256
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - path: data/usc-113-nomic-no-meta-chunks-v1-s2048-o256.parquet split: '113' - path: data/usc-114-nomic-no-meta-chunks-v1-s2048-o256.parquet split: '114' - path: data/usc-115-nomic-no-meta-chunks-v1-s2048-o256.parquet split: '115' - path: data/usc-116-nomic-no-meta-chunks-v1-s2048-o256.parquet split: '116' - path: data/usc-117-nomic-no-meta-chunks-v1-s2048-o256.parquet split: '117' - path: data/usc-118-nomic-no-meta-chunks-v1-s2048-o256.parquet split: '118' dataset_info: features: - dtype: string name: chunk_id - dtype: string name: congress_num - dtype: string name: nomic_topic_depth_1 - dtype: string name: nomic_topic_depth_2 - dtype: string name: nomic_topic_depth_3 - dtype: float32 name: nomic_proj_x - dtype: float32 name: nomic_proj_y - list: dtype: float32 name: nomic_vec ---
提供机构:
hyperdemocracy
原始信息汇总

数据集概述

数据文件配置

  • 配置名称: default
  • 数据文件路径及分割:
    • data/usc-113-nomic-no-meta-chunks-v1-s2048-o256.parquet: 分割 113
    • data/usc-114-nomic-no-meta-chunks-v1-s2048-o256.parquet: 分割 114
    • data/usc-115-nomic-no-meta-chunks-v1-s2048-o256.parquet: 分割 115
    • data/usc-116-nomic-no-meta-chunks-v1-s2048-o256.parquet: 分割 116
    • data/usc-117-nomic-no-meta-chunks-v1-s2048-o256.parquet: 分割 117
    • data/usc-118-nomic-no-meta-chunks-v1-s2048-o256.parquet: 分割 118

数据集信息

  • 特征:
    • chunk_id: 数据类型 string
    • congress_num: 数据类型 string
    • nomic_topic_depth_1: 数据类型 string
    • nomic_topic_depth_2: 数据类型 string
    • nomic_topic_depth_3: 数据类型 string
    • nomic_proj_x: 数据类型 float32
    • nomic_proj_y: 数据类型 float32
    • nomic_vec: 数据类型 list 包含 float32
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作