five

oitnews/test_vectors

收藏
Hugging Face2024-11-03 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/oitnews/test_vectors
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: config_name: W20241103 features: - name: id dtype: string - name: document dtype: string - name: metadata struct: - name: author dtype: string - name: content dtype: string - name: country dtype: string - name: description dtype: string - name: image dtype: string - name: link dtype: string - name: published dtype: string - name: source dtype: string - name: summary dtype: string - name: title dtype: string - name: embedding sequence: float64 splits: - name: train num_bytes: 36435 num_examples: 15 download_size: 12905 dataset_size: 36435 configs: - config_name: W20241103 data_files: - split: train path: W20241103/train-* ---

数据集信息: 配置名称:W20241103 特征字段: - 字段名:ID,数据类型:字符串 - 字段名:文档(document),数据类型:字符串 - 字段名:元数据(metadata),为结构体类型,包含子字段如下: - 子字段名:作者(author),数据类型:字符串 - 子字段名:内容(content),数据类型:字符串 - 子字段名:国家(country),数据类型:字符串 - 子字段名:描述(description),数据类型:字符串 - 子字段名:图片(image),数据类型:字符串 - 子字段名:链接(link),数据类型:字符串 - 子字段名:发布时间(published),数据类型:字符串 - 子字段名:来源(source),数据类型:字符串 - 子字段名:摘要(summary),数据类型:字符串 - 子字段名:标题(title),数据类型:字符串 - 字段名:嵌入向量(embedding),为64位浮点型序列 数据集拆分: - 拆分名称:训练集(train),字节占用量:36435,样本数量:15 下载大小:12905 数据集总大小:36435 配置项: - 配置名称:W20241103,数据文件: - 拆分名称:训练集(train),文件路径:W20241103/train-*
提供机构:
oitnews
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作