东南亚各国知识产权法律中英双语结构化对照数据集(向量库)
收藏上海市数据产品知识产权管理平台2026-04-16 更新2026-04-17 收录
下载链接:
https://sjdj.sipa.sh.gov.cn/#/home/view/publicNotice
下载链接
链接失效反馈官方服务:
资源简介:
原文件采用 Excel (.xlsx) 二维表结构存储,字段共包含法律名称(文本型)、法律编号、项序、法条原文(文本型)、法条中文翻译(文本型)、创建时间、更新时间、删除时间共8个字段,以法律名称/法律编号+项序为联合主键,更新时间、删除时间可为空,共4173条记录;vector_index.faiss是核心的FAISS 向量索引文件,embeddings.npy是原始的NumPy 二进制文件、向量嵌入数据文件,存储了所有法律条文的TF-IDF向量表示。metadata.json存储了与向量对应的元数据,包含法律条文的详细信息(如法律名称、原文、中文翻译等),当查询返回向量索引时,系统会通过这个文件获取对应的法律条文信息。 tfidf_vectorizer.joblib是TF-IDF向量器,用于将新的查询文本转换为与向量库中向量格式一致的向量表示。
提供机构:
丝桥知律(重庆)信息技术有限责任公司
创建时间:
2026-04-16
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个结构化的数据集合,专门整理了东南亚各国知识产权相关法律的中文和英文双语对照文本,并以向量库形式存储。它由专业机构加工处理,旨在提供标准化、可计算的法律信息,便于进行跨语言法律比较、分析或作为机器学习模型的训练数据。
以上内容由遇见数据集搜集并总结生成



