SgMy-Compliance-Instruct-500
收藏SgMy-Compliance-Instruct-500 数据集详情
数据集概述
SgMy-Compliance-Instruct-500 是一个高质量、专家策划的指令微调数据集,包含 500 条数据,专注于东南亚地区(特别是 马来西亚和新加坡)的监管环境。
该数据集旨在训练大型语言模型(LLM),从简单的文档摘要过渡到 专业的监管推理,使用结构化的“初学者 vs. 专家”思维链方法。
五大支柱领域
数据集按五大支柱平均分布,每个支柱 100 条数据:
| 支柱编号 | 支柱名称 | 管辖区域 | 主要覆盖法规 |
|---|---|---|---|
| 1 | 银行反洗钱/了解你的客户 | 马来西亚、新加坡、全球 | 2001年反洗钱法、新加坡金融管理局第626号通知、马来西亚国家银行反洗钱/反恐融资/反扩散融资政策、反洗钱金融行动特别工作组建议 |
| 2 | 数据隐私 | 马来西亚、新加坡 | 马来西亚2010年个人数据保护法、新加坡2012年个人数据保护法、谢绝来电登记处 |
| 3 | 技术风险 | 马来西亚、新加坡 | 马来西亚国家银行风险管理信息技术、新加坡金融管理局技术风险管理指南 |
| 4 | 工作场所安全 | 马来西亚、新加坡 | 马来西亚1994年职业安全与健康法(2022年修订)、新加坡工作场所安全与健康法 |
| 5 | 数字资产 | 马来西亚、新加坡 | 马来西亚证券委员会数字资产交易所/首次交易所发行指南、新加坡金融管理局支付服务法 |
数据结构
数据集以 .jsonl 格式提供,每行是一个独立的 JSON 对象,包含以下字段:
pillar:主题类别(1-5)context:具体的监管引文或规则片段instruction:真实的商业困境、员工查询或边缘案例场景thought:内部推理块,遵循 初学者 vs. 专家 逻辑response:专业、有法律依据的答复,引用相关文档
示例条目
json { "pillar": "1_Banking_AML_KYC", "context": "[Document AML-01] BNM AML/CFT/CPF Policy, Para 14.10: For high-risk customers, reporting institutions must perform Enhanced Due Diligence (EDD).", "instruction": "A corporate client is owned 30% by a Trust in a tax haven. Is standard KYC sufficient?", "thought": "<think>[Naive Impulse]: 30% is a lot, so just get the registration papers. [Expert Critique]: Under BNM, 25% triggers BO identification, and tax havens elevate risk. [Corrected Logic]: EDD is mandatory due to jurisdiction and ownership.</think>", "response": "No, standard KYC is insufficient. According to [Document AML-01], since the ownership exceeds 25% and involves a high-risk jurisdiction, the bank must perform Enhanced Due Diligence (EDD)." }
数据集高质量特点
- 初学者 vs. 专家推理架构:每个条目包含思维块,识别常见错误(初学者冲动)、使用法律原则进行批判(专家批判),并综合正确路径(修正逻辑),训练模型的合规判断过程。
- 严格监管依据(适合检索增强生成):每条回答都锚定到特定的文档ID和监管框架,是测试检索增强生成系统能否检索到确切来源的理想基准。
- 操作边缘案例:指令聚焦于控制权 vs. 所有权、泄密悖论、现代技术风险等复杂困境。
- 管辖区域细微差异:捕捉马来西亚和新加坡之间的具体差异,如不同报告时限和本地治理。
限制与声明
- 非法律建议:仅供人工智能训练和研究使用。
- 时间敏感性:数据反映截至 2024年初 的法规,未来修订可能使部分条目过时。
- 地理范围:逻辑严格针对 马来西亚和新加坡,不适用于其他司法管辖区。
- 非穷尽性:虽覆盖500个高风险场景,但并非这些地区所有法律的完整百科全书。
支持的任务
- 监督式微调:训练模型作为专业的合规顾问
- 思维链蒸馏:使用推理块改进小型模型的逻辑能力
- 检索增强生成基准测试:针对特定文档ID测试检索准确性
- 合规红队测试:评估模型在受到业务指令压力时是否会抵制走捷径或社会工程攻击




