five

blade57/ModelNumbers4Searching_Full

收藏
Hugging Face2024-05-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/blade57/ModelNumbers4Searching_Full
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为ModelsNumbers,由Faker生成,用于测试使用向量化模型编号进行搜索。数据集不包含嵌入向量,但提到了其他数据集可能包含较小的样本和嵌入向量。数据集包含50,000条记录,列包括品牌、型号编号、型号名称、年份、随机数据(用于在型号编号字符数少于6时附加)、模型搜索(从型号编号中移除某些字符,用于创建嵌入向量)以及模型搜索嵌入(仅在文件名中包含embeddings的数据集中存在)。

该数据集名为ModelsNumbers,由Faker生成,用于测试使用向量化模型编号进行搜索。数据集不包含嵌入向量,但提到了其他数据集可能包含较小的样本和嵌入向量。数据集包含50,000条记录,列包括品牌、型号编号、型号名称、年份、随机数据(用于在型号编号字符数少于6时附加)、模型搜索(从型号编号中移除某些字符,用于创建嵌入向量)以及模型搜索嵌入(仅在文件名中包含embeddings的数据集中存在)。
提供机构:
blade57
原始信息汇总

数据集概述

数据集名称

  • ModelsNumbers

数据集描述

  • 由Faker生成,用于测试使用向量化模型编号进行搜索的数据。
  • 本数据集不包含嵌入(embeddings)。

数据集大小

  • 包含50,000条记录。

数据集结构

  • 品牌 (brand)
  • 型号编号 (model_number)
  • 型号名称 (model_name)
  • 年份 (year)
  • 随机数据 (randomdata): 值介于1000至2000之间,如果伪造的值少于6个字符,则附加到型号编号。
  • 模型搜索 (model_search): 从型号编号中移除部分字符,用于创建嵌入。
  • 模型搜索嵌入 (model_search_embeddings): 仅在文件名中添加了embeddings的那些数据集中存在。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作