PandaVT/chinese_law_examples
收藏数据集概述
数据集内容
- 文件名:
law_item.jsonl - 样本数量: 1000
- 内容描述: 包含当前有效的中国法律条文样本。
示例条目
json { "title": "《中华人民共和国劳动合同法(2012修正)》", "classification": "类别 : 劳动合同营商环境优化 ", "num": "第十九条", "contents": "第十九条【试用期】劳动合同期限三个月以上不满一年的,试用期不得超过一个月;劳动合同期限一年以上不满三年的,试用期不得超过二个月;三年以上固定期限和无固定期限的劳动合同,试用期不得超过六个月。同一用人单位与同一劳动者只能约定一次试用期。以完成一定工作任务为期限的劳动合同或者劳动合同期限不满三个月的,不得约定试用期。试用期包含在劳动合同期限内。劳动合同仅约定试用期的,试用期不成立,该期限为劳动合同期限。" }
使用示例
-
目的: 使用BGE Embedding计算查询与法律条文之间的相似度。
-
代码示例: python from FlagEmbedding import FlagModel from datasets import load_dataset
dataset = load_dataset("FarReelAILab/law_examples") model = FlagModel(BAAI/bge-large-zh-v1.5, query_instruction_for_retrieval="为这个句子生成表示以用于检索相关文章:", use_fp16=True)
queries = [我是中职生,在一家酒店工作,试用期内上班7天了,现在辞职工资还会有吗?, 工作时间每天12个小时,早上十点上班中间基本不休息,然后到晚上11-12点下班有时候说加班就加班想辞职走人酒店压着工资不让走怎么办?] passages = [f"法律:{dataset[train][11][title]},法条:{dataset[train][11][contents]}", f"法律:{dataset[train][173][title]},法条:{dataset[train][173][contents]}"] print(f"法律:{dataset[train][11][title]},法条:{dataset[train][11][contents]}") print(f"法律:{dataset[train][173][title]},法条:{dataset[train][173][contents]}") q_embeddings = model.encode_queries(queries) p_embeddings = model.encode(passages) scores = q_embeddings @ p_embeddings.T print(scores)
-
输出示例: python 法律:《中华人民共和国劳动合同法(2012修正)》,法条:第十九条【试用期】劳动合同期限三个月以上不满一年的,试用期不得超过一个月;劳动合同期限一年以上不满三年的,试用期不得超过二个月;三年以上固定期限和无固定期限的劳动合同,试用期不得超过六个月。同一用人单位与同一劳动者只能约定一次试用期。以完成一定工作任务为期限的劳动合同或者劳动合同期限不满三个月的,不得约定试用期。试用期包含在劳动合同期限内。劳动合同仅约定试用期的,试用期不成立,该期限为劳动合同期限。 法律:《中华人民共和国劳动法(2018修正)》,法条:第四十三条用人单位不得违反本法规定延长劳动者的工作时间。 [[0.7573 0.72 ] [0.7417 0.7734]]




