five

hyperdemocracy/usc-nomic-no-meta-chunks-v1-s1024-o256

收藏
Hugging Face2024-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hyperdemocracy/usc-nomic-no-meta-chunks-v1-s1024-o256
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - path: data/usc-113-nomic-no-meta-chunks-v1-s1024-o256.parquet split: '113' - path: data/usc-114-nomic-no-meta-chunks-v1-s1024-o256.parquet split: '114' - path: data/usc-115-nomic-no-meta-chunks-v1-s1024-o256.parquet split: '115' - path: data/usc-116-nomic-no-meta-chunks-v1-s1024-o256.parquet split: '116' - path: data/usc-117-nomic-no-meta-chunks-v1-s1024-o256.parquet split: '117' - path: data/usc-118-nomic-no-meta-chunks-v1-s1024-o256.parquet split: '118' dataset_info: features: - dtype: string name: chunk_id - dtype: string name: congress_num - dtype: string name: nomic_topic_depth_1 - dtype: string name: nomic_topic_depth_2 - dtype: string name: nomic_topic_depth_3 - dtype: float32 name: nomic_proj_x - dtype: float32 name: nomic_proj_y - list: dtype: float32 name: nomic_vec ---

配置: - 配置名称:默认 数据文件: - 文件路径:data/usc-113-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'113' - 文件路径:data/usc-114-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'114' - 文件路径:data/usc-115-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'115' - 文件路径:data/usc-116-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'116' - 文件路径:data/usc-117-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'117' - 文件路径:data/usc-118-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'118' 数据集信息: 特征字段: - 数据类型(dtype):字符串类型(string),字段名:分块ID(chunk_id) - 数据类型(dtype):字符串类型(string),字段名:国会届数(congress_num) - 数据类型(dtype):字符串类型(string),字段名:Nomic一级主题(nomic_topic_depth_1) - 数据类型(dtype):字符串类型(string),字段名:Nomic二级主题(nomic_topic_depth_2) - 数据类型(dtype):字符串类型(string),字段名:Nomic三级主题(nomic_topic_depth_3) - 数据类型(dtype):32位浮点型(float32),字段名:Nomic投影X坐标(nomic_proj_x) - 数据类型(dtype):32位浮点型(float32),字段名:Nomic投影Y坐标(nomic_proj_y) - 数据类型(dtype):列表类型(list),元素数据类型为32位浮点型(float32),字段名:Nomic向量(nomic_vec)
提供机构:
hyperdemocracy
原始信息汇总

数据集配置

  • 配置名称: default
  • 数据文件:
    • 路径: data/usc-113-nomic-no-meta-chunks-v1-s1024-o256.parquet
      • 拆分: 113
    • 路径: data/usc-114-nomic-no-meta-chunks-v1-s1024-o256.parquet
      • 拆分: 114
    • 路径: data/usc-115-nomic-no-meta-chunks-v1-s1024-o256.parquet
      • 拆分: 115
    • 路径: data/usc-116-nomic-no-meta-chunks-v1-s1024-o256.parquet
      • 拆分: 116
    • 路径: data/usc-117-nomic-no-meta-chunks-v1-s1024-o256.parquet
      • 拆分: 117
    • 路径: data/usc-118-nomic-no-meta-chunks-v1-s1024-o256.parquet
      • 拆分: 118

数据集信息

  • 特征:
    • 名称: chunk_id
      • 数据类型: string
    • 名称: congress_num
      • 数据类型: string
    • 名称: nomic_topic_depth_1
      • 数据类型: string
    • 名称: nomic_topic_depth_2
      • 数据类型: string
    • 名称: nomic_topic_depth_3
      • 数据类型: string
    • 名称: nomic_proj_x
      • 数据类型: float32
    • 名称: nomic_proj_y
      • 数据类型: float32
    • 名称: nomic_vec
      • 数据类型: list of float32
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作