贵州工匠行2500万人资和法律问答模型语料数据集
收藏贵州省数据知识产权登记平台2026-04-29 更新2026-04-30 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=2795&type=1
下载链接
链接失效反馈官方服务:
资源简介:
数据集依托人资、法律领域专业规范制定采集与整理规则,通过文本爬虫、内容去重、敏感内容过滤算法完成原始数据清洗。采用语义聚类、内容分类、句式归一化处理规则,统一问答句式与表述口径,规范字段结构。结合专业人工审核、合规校验、交叉校对机制筛选优质语料,剔除无效、违规内容,保障问答内容严谨准确、逻辑规范,适配垂直领域大模型训练、知识库构建与智能问答算法迭代使用。
提供机构:
贵州工匠行科技有限公司
创建时间:
2026-04-28
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是贵州工匠行科技有限公司构建的2500万人资与法律问答语料库,主要服务于法律及人资领域的大模型训练、智能问答系统研发和知识库搭建。数据经过文本爬取、去重、敏感内容过滤及人工审核等多重算法处理,确保问答内容的严谨性和规范性,可广泛应用于企业人事合规咨询、法律科普、智能客服等场景,为行业垂直AI落地提供核心数据支撑。
以上内容由遇见数据集搜集并总结生成



