five

解题大模型训练用逻辑思维问题的答案数据

收藏
浙江省数据知识产权登记平台2025-03-19 更新2025-03-20 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/118294
下载链接
链接失效反馈
官方服务:
资源简介:
用于AI大模型领域中解题大模型训练: 1.提升大模型对用户提出的逻辑思维问题的上下文理解能力,使大模型能精准回答用户问题点,减少答非所问或无法回答的情况 2.扩展大模型的解答逻辑,增加解答的多面性与辩证性1.数据预处理:整理逻辑思维类的选择性问题(选择题)与作答型问题(填空题),将选择题的选项依次标记为选项a~h。 2.生产答案数据:使用公司自研的数据标注平台,由标注员人工编写答案及解析,并标注问题的一级分类和二级分类 3.人工内容抽检:聘请专业技术人员对生成代码正确性、规范性、题目相关性以1%抽检率(共15万条数据,抽检1500条)进行人工检查,抽检不合格率为3.58%,符合业内大部分大模型对训练数据的质量要求 4.敏感词检测:调用算法对所有数据进行敏感词检测,包括涉黄、涉暴、涉恐及政治敏感词检测及过滤
提供机构:
杭州景联文科技有限公司
创建时间:
2025-01-02
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含51429条逻辑思维问题的答案数据,用于AI大模型训练,提升模型对逻辑思维问题的理解和解答能力。数据经过人工编写、抽检和敏感词检测,确保质量和安全性。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务