blade57/ModelNumber_Sample

Name: blade57/ModelNumber_Sample
Creator: blade57
Published: 2024-05-09 19:48:51
License: 暂无描述

Hugging Face2024-05-09 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/blade57/ModelNumber_Sample

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为ModelsNumbers，由Faker生成，主要用于测试使用向量化模型编号进行搜索的功能。数据集包含50,000条记录，主要列包括品牌、型号编号、型号名称、年份、随机数据（用于补充短于6字符的型号编号）、模型搜索（从型号编号中移除某些字符，用于创建嵌入）以及模型搜索嵌入（仅在文件名中包含embeddings的数据集中存在）。

提供机构：

blade57

原始信息汇总

数据集概述：ModelsNumbers

数据集描述

生成工具：由Faker生成，用于测试通过向量化模型编号进行搜索的数据。
数据规模：包含50,000条记录。

数据集结构

数据集包含以下字段：

品牌 (brand)
模型编号 (model_number)
模型名称 (model_name)
年份 (year)
随机数据 (randomdata)：数值范围在1000至2000之间。如果伪造的值少于6个字符，则附加到模型编号后。
模型搜索 (model_search)：从模型编号中移除部分字符，用于创建嵌入。
模型搜索嵌入 (model_search_embeddings)：仅存在于文件名中添加了embeddings的那些数据集中。

5,000+

优质数据集

54 个

任务类型

进入经典数据集