个人数据集
收藏魔搭社区2026-05-27 更新2025-03-15 收录
下载链接:
https://modelscope.cn/datasets/yangshan96/my_data_set
下载链接
链接失效反馈官方服务:
资源简介:
# DISC-Law-SFT Dataset
Legal Intelligent systems in Chinese require a combination of various abilities, including legal text understanding and generation. To achieve this, we have constructed a high-quality supervised fine-tuning dataset called DISC-Law-SFT, which covers different legal scenarios such as legal information extraction, legal judgment prediction, legal document summarization, and legal question answering. DISC-Law-SFT comprises two subsets, DISC-Law-SFT-Pair and DISC-Law-SFT-Triplet. The former aims to introduce legal reasoning abilities to the LLM, while the latter helps enhance the model's capability to utilize external legal knowledge. For more detailed information, please refer to our [technical report](https://arxiv.org/abs/2309.11325). The distribution of the dataset is:
We currently open-source most of the DISC-Law-SFT Dataset.
More detail and news check our [homepage](https://github.com/FudanDISC/DISC-LawLLM) !
# DISC-Law-SFT 数据集
中文法律智能系统需要融合多项核心能力,涵盖法律文本理解与生成等多个维度。为实现这一目标,我们构建了一款高质量监督微调数据集——DISC-Law-SFT,其覆盖法律信息抽取、法律判决预测、法律文档摘要、法律问答等多元法律应用场景。
该数据集包含两个子集:DISC-Law-SFT-Pair 与 DISC-Law-SFT-Triplet。其中前者旨在为大语言模型(Large Language Model,LLM)注入法律推理能力,后者则用于增强模型对外部法律知识的利用能力。如需获取更详细的信息,请参阅我们的[技术报告](https://arxiv.org/abs/2309.11325)。本数据集的分发情况如下:
目前我们已开源绝大多数DISC-Law-SFT数据集。更多详情与最新动态,请访问我们的[项目主页](https://github.com/FudanDISC/DISC-LawLLM)!
提供机构:
maas
创建时间:
2025-03-11
搜集汇总
数据集介绍

背景与挑战
背景概述
DISC-Law-SFT是一个中文法律智能系统的监督微调数据集,包含DISC-Law-SFT-Pair和DISC-Law-SFT-Triplet两个子集,覆盖法律信息抽取、判决预测、文档摘要和问答等多种场景,旨在增强模型的法律推理和外部知识利用能力。该数据集基于Apache License 2.0开源,由yangshan96维护,最近更新于2025年3月11日。
以上内容由遇见数据集搜集并总结生成



