five

blade57/ModelNumber_Sample

收藏
Hugging Face2024-05-09 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/blade57/ModelNumber_Sample
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为ModelsNumbers,由Faker生成,主要用于测试使用向量化模型编号进行搜索的功能。数据集包含50,000条记录,主要列包括品牌、型号编号、型号名称、年份、随机数据(用于补充短于6字符的型号编号)、模型搜索(从型号编号中移除某些字符,用于创建嵌入)以及模型搜索嵌入(仅在文件名中包含embeddings的数据集中存在)。

该数据集名为ModelsNumbers,由Faker生成,主要用于测试使用向量化模型编号进行搜索的功能。数据集包含50,000条记录,主要列包括品牌、型号编号、型号名称、年份、随机数据(用于补充短于6字符的型号编号)、模型搜索(从型号编号中移除某些字符,用于创建嵌入)以及模型搜索嵌入(仅在文件名中包含embeddings的数据集中存在)。
提供机构:
blade57
原始信息汇总

数据集概述:ModelsNumbers

数据集描述

  • 生成工具:由Faker生成,用于测试通过向量化模型编号进行搜索的数据。
  • 数据规模:包含50,000条记录。

数据集结构

数据集包含以下字段:

  • 品牌 (brand)
  • 模型编号 (model_number)
  • 模型名称 (model_name)
  • 年份 (year)
  • 随机数据 (randomdata):数值范围在1000至2000之间。如果伪造的值少于6个字符,则附加到模型编号后。
  • 模型搜索 (model_search):从模型编号中移除部分字符,用于创建嵌入。
  • 模型搜索嵌入 (model_search_embeddings):仅存在于文件名中添加了embeddings的那些数据集中。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作