消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达

4月29日消息,据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。

报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。

据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。

消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达

文章来源于网络。发布者:问财网,转转请注明出处:https://www.enmeizan.com/4422.html

(0)
问财网的头像问财网
上一篇 2025年4月29日 上午10:19
下一篇 2025年4月29日 上午10:19

相关推荐

  • 你还觉得机票贵吗 航司运送一位乘客每公里只赚5毛3

    4月30日消息,据报道,五一假期即将来临,不少打工人期待的五一机票价格跳水并没有出现,甚至还有人等来了天崩开局,之前票价低的时候没下手,希望五一假期价格下来后再买,结果眼睁睁地看着机票的价格涨了起来。 还有人玩起来玄学,他们在社交平台发布反向驯服算法攻略:先写上十几遍机票太贵,不去了,再对航空公司表忠心,最后强调自己每天都在关注某地到某地的机票。 不过,购票…

    2025年4月30日
    500
  • 5款最好的安卓界面设计工具推荐

    5款优秀的安卓界面设计工具,简单实用,快Get起来吧!

    2017年4月21日
    1211
  • 老牌国货:名流玻尿酸003超润薄24枚11.9元包邮

    名流003超润薄24枚官方标价208.9元,领取134元大额券,实付11.9元包邮。 需拍宝贝倒数第一项,官方品质保证。 购买链接:天猫(19.9元) 名流成立于2002年,老国货牌子了,目前已被正式列入** 集中采购企业,质量有保障。 购买提醒: 天猫名流官方旗舰店商品,正品保障,支持七天无理由退换,赠运费险,请查看最新评价后再入手~ 【广告】本文用于优惠…

    2025年4月29日
    400
  • 70岁大妈连续7天爬楼梯偷100多个快递 称自己没事想解解闷

    4月26日消息,近日,一则令人咋舌的消息引发关注。有媒体在社交平台发布视频,曝光了北京市朝阳区六里屯一位70多岁退休大妈偷快递的荒唐行径。 按照民警的说法,这位70岁的朝阳大妈平时爬楼梯上下楼都不喘气,因为没有日常的爱好习惯,于是就爬楼梯偷快递。 据大妈自己交代,她只是每天来回溜达着偷,只为打发无聊的退休时光。 从网传视频画面中能清晰看到,为了方便偷快递,大…

    2025年4月26日
    700
  • REDMI Turbo 4 Pro打破2025首销纪录:全价位段首销销量第一!

    4月26日消息,REDMI官方宣布,Turbo 4 Pro打破2025首销纪录,获得全价位段首销销量第一。 王腾发文表示:有人把产品跟随改名成Turbo,有人在学我们四五年前的外观,有人直接把宣传语也改成能打,但用户的认可他们学不了。 日前官方还透露,Turbo 4 Pro开售1小时销量就超过了标准版全天,非常抢手。 Turbo 4 Pro外观上与标准版基本…

    2025年4月26日
    800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信