five

hyperdemocracy/usc-nomic-no-meta-chunks-v1-s4096-o512

收藏
Hugging Face2024-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hyperdemocracy/usc-nomic-no-meta-chunks-v1-s4096-o512
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - path: data/usc-113-nomic-no-meta-chunks-v1-s4096-o512.parquet split: '113' - path: data/usc-114-nomic-no-meta-chunks-v1-s4096-o512.parquet split: '114' - path: data/usc-115-nomic-no-meta-chunks-v1-s4096-o512.parquet split: '115' - path: data/usc-116-nomic-no-meta-chunks-v1-s4096-o512.parquet split: '116' - path: data/usc-117-nomic-no-meta-chunks-v1-s4096-o512.parquet split: '117' - path: data/usc-118-nomic-no-meta-chunks-v1-s4096-o512.parquet split: '118' dataset_info: features: - dtype: string name: chunk_id - dtype: string name: congress_num - dtype: string name: nomic_topic_depth_1 - dtype: string name: nomic_topic_depth_2 - dtype: string name: nomic_topic_depth_3 - dtype: float32 name: nomic_proj_x - dtype: float32 name: nomic_proj_y - list: dtype: float32 name: nomic_vec ---
提供机构:
hyperdemocracy
原始信息汇总

数据集配置

  • 配置名称: default
    • 数据文件:
      • 路径: data/usc-113-nomic-no-meta-chunks-v1-s4096-o512.parquet
        • 分割: 113
      • 路径: data/usc-114-nomic-no-meta-chunks-v1-s4096-o512.parquet
        • 分割: 114
      • 路径: data/usc-115-nomic-no-meta-chunks-v1-s4096-o512.parquet
        • 分割: 115
      • 路径: data/usc-116-nomic-no-meta-chunks-v1-s4096-o512.parquet
        • 分割: 116
      • 路径: data/usc-117-nomic-no-meta-chunks-v1-s4096-o512.parquet
        • 分割: 117
      • 路径: data/usc-118-nomic-no-meta-chunks-v1-s4096-o512.parquet
        • 分割: 118

数据集信息

  • 特征:
    • 名称: chunk_id
      • 数据类型: string
    • 名称: congress_num
      • 数据类型: string
    • 名称: nomic_topic_depth_1
      • 数据类型: string
    • 名称: nomic_topic_depth_2
      • 数据类型: string
    • 名称: nomic_topic_depth_3
      • 数据类型: string
    • 名称: nomic_proj_x
      • 数据类型: float32
    • 名称: nomic_proj_y
      • 数据类型: float32
    • 名称: nomic_vec
      • 数据类型: list of float32
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作