欢迎光临BoB体育直播!

联系电话:0577-62891398
产品详情
BoB体育直播
手机:18968959996
电话:0577-62891398
传真:0577-62891298
邮箱:154872686@qq.com
地址:浙江乐清柳市站东路155#店后德力西工业园
网址:http://www.sxd5656.com


Notice: Undefined variable: a in /www/wwwroot/sxd5656.com/cache/template/6e69/d818/1e9d1b558ab8178098b2.html on line 60

Notice: Trying to access array offset on value of type null in /www/wwwroot/sxd5656.com/cache/template/6e69/d818/1e9d1b558ab8178098b2.html on line 60

首页 > 产品中心

200Ah/110V柜式直流电源

「商汤」大模型一体机可节约80%推理成本完成云端边全栈布局|最前线

来源:BoB体育直播    发布时间:2024-04-25 08:46:06

产品详情

  昨日,商汤科技SenseTime在上海举办技术交流日活动。会上商汤发布业内首个“云、端、边”全栈大模型产品矩阵,并推出全新升级的“日日新SenseNova 5.0”大模型体系。

  影响至股价方面,商汤今日开盘后大面积上涨。随后商汤在港交所公告称,商汤集团的B类股份自11时15分起暂停交易,暂停前涨幅达到31.15%。

  日日新,出自《礼记·大学》中的“苟日新、日日新、又日新”。承载了人们对以大模型为代表的AI技术浪潮迭代,和走向AGI(通用AI)的期待。

  目前,商汤“日日新SenseNova”大模型体系已正式完成5个版本迭代,基于超过10TB tokens训练、覆盖大量合成数据,“日日新SenseNova 5.0”(以下简称:「日日新5.0」)采用混合专家架构,推理时上下文窗口可以轻松又有效到200K左右。

  具体到更新能力上,此次主要集中增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。

  以模型的文科能力为例,「日日新5.0」创意写作能力、推理能力及总结能力均大幅度的提高,相同的中文知识注入后,能够得到更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。

  多模态能力方面,具体到应用产品中,「日日新5.0」可支持高清长图的解析和理解,以及文生图交互式生成,也能实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。

  「日日新5.0」和GPT-4回答趣味推理问题:“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”,「日日新5.0」回答正确。

  面对中心化算力需求向端侧扩展的未来趋势、和企业级在边缘侧的AI需求,商汤推出了“云、端、边”全栈大模型产品矩阵。这中间还包括应用于终端设备的“商汤端侧大模型”,及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

  当前,金融、代码、医疗、政务等行业边缘侧AI应用需求呈爆发式增长,但在实际落地场景中,企业仍面临算力使用门槛高、能耗高等难题。

  关注到这一现象,商汤寻求最优数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

  会上,商汤推出端云协同解决方案,能够最终靠智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过80%,从而明显降低推理成本。

  比如近期火爆的小米汽车SU7,其智能车舱中就应用了商汤的大模型技术。基于商汤端云大模型解决方案,小米小爱同学可以为车主提供智能化的交互体验。

  同时在硬件方面,商汤本次发布的企业级大模型一体机,可支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同种类型的产品,推理成本节约80%,检索大大加速,CPU工作负载50%。

  伴随着尺度定律催生的模型性能大爆发,一方面,大模型发展已进入落地阶段,如何与产业、应用场景结合是关键一环;另一方面,“ScalingLaw(尺度定律)”路径逐渐清晰,“涌现”时刻不定出现,前瞻探索最先进的大模型技术也是重中之重。

  商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”

相关产品