oitnews/test_vectors
收藏Hugging Face2024-11-03 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/oitnews/test_vectors
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
config_name: W20241103
features:
- name: id
dtype: string
- name: document
dtype: string
- name: metadata
struct:
- name: author
dtype: string
- name: content
dtype: string
- name: country
dtype: string
- name: description
dtype: string
- name: image
dtype: string
- name: link
dtype: string
- name: published
dtype: string
- name: source
dtype: string
- name: summary
dtype: string
- name: title
dtype: string
- name: embedding
sequence: float64
splits:
- name: train
num_bytes: 36435
num_examples: 15
download_size: 12905
dataset_size: 36435
configs:
- config_name: W20241103
data_files:
- split: train
path: W20241103/train-*
---
数据集信息:
配置名称:W20241103
特征字段:
- 字段名:ID,数据类型:字符串
- 字段名:文档(document),数据类型:字符串
- 字段名:元数据(metadata),为结构体类型,包含子字段如下:
- 子字段名:作者(author),数据类型:字符串
- 子字段名:内容(content),数据类型:字符串
- 子字段名:国家(country),数据类型:字符串
- 子字段名:描述(description),数据类型:字符串
- 子字段名:图片(image),数据类型:字符串
- 子字段名:链接(link),数据类型:字符串
- 子字段名:发布时间(published),数据类型:字符串
- 子字段名:来源(source),数据类型:字符串
- 子字段名:摘要(summary),数据类型:字符串
- 子字段名:标题(title),数据类型:字符串
- 字段名:嵌入向量(embedding),为64位浮点型序列
数据集拆分:
- 拆分名称:训练集(train),字节占用量:36435,样本数量:15
下载大小:12905
数据集总大小:36435
配置项:
- 配置名称:W20241103,数据文件:
- 拆分名称:训练集(train),文件路径:W20241103/train-*
提供机构:
oitnews



