blade57/ModelNumber_Sample
收藏Hugging Face2024-05-09 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/blade57/ModelNumber_Sample
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为ModelsNumbers,由Faker生成,主要用于测试使用向量化模型编号进行搜索的功能。数据集包含50,000条记录,主要列包括品牌、型号编号、型号名称、年份、随机数据(用于补充短于6字符的型号编号)、模型搜索(从型号编号中移除某些字符,用于创建嵌入)以及模型搜索嵌入(仅在文件名中包含embeddings的数据集中存在)。
该数据集名为ModelsNumbers,由Faker生成,主要用于测试使用向量化模型编号进行搜索的功能。数据集包含50,000条记录,主要列包括品牌、型号编号、型号名称、年份、随机数据(用于补充短于6字符的型号编号)、模型搜索(从型号编号中移除某些字符,用于创建嵌入)以及模型搜索嵌入(仅在文件名中包含embeddings的数据集中存在)。
提供机构:
blade57
原始信息汇总
数据集概述:ModelsNumbers
数据集描述
- 生成工具:由Faker生成,用于测试通过向量化模型编号进行搜索的数据。
- 数据规模:包含50,000条记录。
数据集结构
数据集包含以下字段:
- 品牌 (brand)
- 模型编号 (model_number)
- 模型名称 (model_name)
- 年份 (year)
- 随机数据 (randomdata):数值范围在1000至2000之间。如果伪造的值少于6个字符,则附加到模型编号后。
- 模型搜索 (model_search):从模型编号中移除部分字符,用于创建嵌入。
- 模型搜索嵌入 (model_search_embeddings):仅存在于文件名中添加了embeddings的那些数据集中。



