hyperdemocracy/usc-nomic-no-meta-chunks-v1-s1024-o256
收藏Hugging Face2024-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hyperdemocracy/usc-nomic-no-meta-chunks-v1-s1024-o256
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- path: data/usc-113-nomic-no-meta-chunks-v1-s1024-o256.parquet
split: '113'
- path: data/usc-114-nomic-no-meta-chunks-v1-s1024-o256.parquet
split: '114'
- path: data/usc-115-nomic-no-meta-chunks-v1-s1024-o256.parquet
split: '115'
- path: data/usc-116-nomic-no-meta-chunks-v1-s1024-o256.parquet
split: '116'
- path: data/usc-117-nomic-no-meta-chunks-v1-s1024-o256.parquet
split: '117'
- path: data/usc-118-nomic-no-meta-chunks-v1-s1024-o256.parquet
split: '118'
dataset_info:
features:
- dtype: string
name: chunk_id
- dtype: string
name: congress_num
- dtype: string
name: nomic_topic_depth_1
- dtype: string
name: nomic_topic_depth_2
- dtype: string
name: nomic_topic_depth_3
- dtype: float32
name: nomic_proj_x
- dtype: float32
name: nomic_proj_y
- list:
dtype: float32
name: nomic_vec
---
配置:
- 配置名称:默认
数据文件:
- 文件路径:data/usc-113-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'113'
- 文件路径:data/usc-114-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'114'
- 文件路径:data/usc-115-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'115'
- 文件路径:data/usc-116-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'116'
- 文件路径:data/usc-117-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'117'
- 文件路径:data/usc-118-nomic-no-meta-chunks-v1-s1024-o256.parquet,数据划分:'118'
数据集信息:
特征字段:
- 数据类型(dtype):字符串类型(string),字段名:分块ID(chunk_id)
- 数据类型(dtype):字符串类型(string),字段名:国会届数(congress_num)
- 数据类型(dtype):字符串类型(string),字段名:Nomic一级主题(nomic_topic_depth_1)
- 数据类型(dtype):字符串类型(string),字段名:Nomic二级主题(nomic_topic_depth_2)
- 数据类型(dtype):字符串类型(string),字段名:Nomic三级主题(nomic_topic_depth_3)
- 数据类型(dtype):32位浮点型(float32),字段名:Nomic投影X坐标(nomic_proj_x)
- 数据类型(dtype):32位浮点型(float32),字段名:Nomic投影Y坐标(nomic_proj_y)
- 数据类型(dtype):列表类型(list),元素数据类型为32位浮点型(float32),字段名:Nomic向量(nomic_vec)
提供机构:
hyperdemocracy
原始信息汇总
数据集配置
- 配置名称: default
- 数据文件:
- 路径: data/usc-113-nomic-no-meta-chunks-v1-s1024-o256.parquet
- 拆分: 113
- 路径: data/usc-114-nomic-no-meta-chunks-v1-s1024-o256.parquet
- 拆分: 114
- 路径: data/usc-115-nomic-no-meta-chunks-v1-s1024-o256.parquet
- 拆分: 115
- 路径: data/usc-116-nomic-no-meta-chunks-v1-s1024-o256.parquet
- 拆分: 116
- 路径: data/usc-117-nomic-no-meta-chunks-v1-s1024-o256.parquet
- 拆分: 117
- 路径: data/usc-118-nomic-no-meta-chunks-v1-s1024-o256.parquet
- 拆分: 118
- 路径: data/usc-113-nomic-no-meta-chunks-v1-s1024-o256.parquet
数据集信息
- 特征:
- 名称: chunk_id
- 数据类型: string
- 名称: congress_num
- 数据类型: string
- 名称: nomic_topic_depth_1
- 数据类型: string
- 名称: nomic_topic_depth_2
- 数据类型: string
- 名称: nomic_topic_depth_3
- 数据类型: string
- 名称: nomic_proj_x
- 数据类型: float32
- 名称: nomic_proj_y
- 数据类型: float32
- 名称: nomic_vec
- 数据类型: list of float32
- 名称: chunk_id



