five

DeepSeek R1

收藏
RapidAPI2026-05-23 更新2025-02-01 收录
下载链接:
https://rapidapi.com/swift-api-swift-api-default/api/deepseek-r1
下载链接
链接失效反馈
官方服务:
资源简介:
DeepSeek-R1 matches the performance of OpenAI's o1 model in complex reasoning tasks, including mathematics and programming, while being 90-95% more cost-effective

DeepSeek-R1模型在数学、编程等复杂推理任务中可与OpenAI的o1模型性能媲美,同时其性价比较后者高出90%至95%
创建时间:
2026-05-23
原始信息汇总

DeepSeek R1 数据集概述

基本信息

  • 数据集名称: DeepSeek R1
  • 类别: 人工智能/机器学习
  • API版本: v1 (current)
  • API提供商: Swift API
  • 订阅计划:
    • BASIC: $1.00 / 月
    • PRO: $10.00 / 月
    • ULTRA: $25.00 / 月
    • MEGA: $75.00 / 月

数据集描述

DeepSeek-R1 是一个开源的大型语言模型 (LLM),专为数学、编码和通用知识等高级推理任务设计。通过强化学习 (RL) 和监督微调 (SFT) 训练,该模型能够自我进化并优化输出以提高清晰度和准确性。

性能指标

  • 数学测试: 79.8% (AIME 2024)
  • 编程能力: Codeforces 评分 2,029 (超过 96.3% 的程序员)
  • 通用知识测试: 90.8% 准确率 (MMLU 基准测试)

特点

  • 完全开源 (MIT 许可证)
  • 性能与 OpenAI 的 o1 模型相当,但成本降低 90-95%
  • 提供多个蒸馏版本的小型模型 (1.5B, 7B, 8B, 14B, 32B, 70B)

训练方法

  1. 后训练: 直接在基础模型上应用强化学习 (RL),无需监督微调 (SFT) 作为初步步骤。
  2. 蒸馏: 将大型模型的推理模式蒸馏到小型模型中,提高性能。

资源

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
DeepSeek R1是一个开源的大型语言模型,专门设计用于数学、编程和一般知识等高级推理任务。它通过强化学习和监督微调训练,在多项基准测试中表现优异,性能与OpenAI o1模型相当但成本效益更高。该模型完全开源并提供API服务,适合开发者和研究人员使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作