blade57/ModelNumbers4Searching_Full
收藏Hugging Face2024-05-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/blade57/ModelNumbers4Searching_Full
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为ModelsNumbers,由Faker生成,用于测试使用向量化模型编号进行搜索。数据集不包含嵌入向量,但提到了其他数据集可能包含较小的样本和嵌入向量。数据集包含50,000条记录,列包括品牌、型号编号、型号名称、年份、随机数据(用于在型号编号字符数少于6时附加)、模型搜索(从型号编号中移除某些字符,用于创建嵌入向量)以及模型搜索嵌入(仅在文件名中包含embeddings的数据集中存在)。
该数据集名为ModelsNumbers,由Faker生成,用于测试使用向量化模型编号进行搜索。数据集不包含嵌入向量,但提到了其他数据集可能包含较小的样本和嵌入向量。数据集包含50,000条记录,列包括品牌、型号编号、型号名称、年份、随机数据(用于在型号编号字符数少于6时附加)、模型搜索(从型号编号中移除某些字符,用于创建嵌入向量)以及模型搜索嵌入(仅在文件名中包含embeddings的数据集中存在)。
提供机构:
blade57
原始信息汇总
数据集概述
数据集名称
- ModelsNumbers
数据集描述
- 由Faker生成,用于测试使用向量化模型编号进行搜索的数据。
- 本数据集不包含嵌入(embeddings)。
数据集大小
- 包含50,000条记录。
数据集结构
- 品牌 (brand)
- 型号编号 (model_number)
- 型号名称 (model_name)
- 年份 (year)
- 随机数据 (randomdata): 值介于1000至2000之间,如果伪造的值少于6个字符,则附加到型号编号。
- 模型搜索 (model_search): 从型号编号中移除部分字符,用于创建嵌入。
- 模型搜索嵌入 (model_search_embeddings): 仅在文件名中添加了embeddings的那些数据集中存在。



