人工智能酝酿下一个爆款

频道:热点快讯 日期: 浏览:3

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  来源:北京商报

  7月的最后一个周末,2025世界人工智能大会(WAIC)吸引了800多家企业参加,宇树人形机器人跳舞、格斗的画面登上多家媒体头版C位,智能眼镜展台排队体验的观众拐了好几个弯。同时举行的100多场论坛中,“智能体”成为高频词,智能体与大模型的关系、智能体的落地路径,从业者一边分享方法论一边观点碰撞。

  “能思考会做事”,不管是线上应用还是具身硬件,2025年的AI以实用为目标。2025 WAIC期间,北京商报记者与科技大厂、智能硬件、垂直赛道等领域高管进行了交流,通过他们的视角,一条人工智能发展的脉络逐渐清晰。当观众们为钢铁之躯按下快门,更新了植入智能体的新版App,下一个行业爆款的种子已悄然埋下。

人工智能酝酿下一个爆款

  智能体与大模型不可类比

  大模型基础能力的成熟,让智能体以极快的速度成为标配,大模型的风头似乎要被取代。事实上智能体与大模型不可类比,前者是应用范畴,后者属于基础底层技术支持,toC(用户)智能体与toB(企业)智能体的打造逻辑也不尽相同。

  腾讯云副总裁吴运声

  不会“昙花一现”

  简单用“放大”或“缩小”大模型的价值来定义智能体不合适,智能体实际上是大模型技术落地在具体行业、产生价值的一个重要形态。

  大模型最终是要落地解决问题的,这个过程会出现很多问题。我们需要思考用什么形态、什么解决方案去解决,智能体就是一个很好的形态。

  我认为这种智能体形态不会短期存在,会是长期的。因为它(智能体)能自动思考、决策、进行环境感知、选择工具,甚至能自动创造工具再进行工具调用,出现了一些崭新的、大模型原生时代所体现的应用特点。智能体和行业大模型也不是取代的关系,我们的目标始终是用技术服务产业,无非是通过怎样的方式去服务。

  想要达到智能体什么都能干,并且能干得很好的理想状态,需要模型、工程、框架、性能调优、数据等全环节高速发展。这会是一个长期迭代发展的过程。

  金山办公助理总裁田然

  只对接API远远不够

  AI必须和软件做深度的融合才能提供最佳的用户体验。比如办公场景,融合不是简单地给软件的1万个API(应用程序编程接口)“教给”AI,一方面API学不会,它没法学习经过大量训练的网络信息,它有自己的编程语言。把流程反过来,从AI到API也不行,AI没办法把自己真正擅长的写进文档里,方便用户去做增减项。

  现在AI办公正在向Agentic Software(代理式软件,即更强大更智能的软件)演进,从业者要做的是针对场景做AI和软件的双向改造,AI软件化的改造是指教会AI用软件,要用一套专门为AI设计的API,软件也要为AI设计专有的能力,最终依靠用户、软件、AI之间多轮交流,输出真正可用的内容。

  技术层面之外,产品可以以助理的形式设计,允许用户跟AI持续讨论,产出想要的内容,这样可以大幅降低大众使用AI的门槛,行业将迎来“人人都有AI助理”的时代。

  阿里云无影总裁张献涛

  需要“拎包入住”的开发环境

  本地设备就像一位“蚂蚁搬家”的苦力,难以支撑高并发、高算力需求的智能体任务,尤其是需要大量GPU(图形处理器)运算的工作,普通办公电脑根本“hold不住”。同时,智能体执行任务时往往会占用本地计算资源和操作权限,严重影响体验。

  云电脑的技术原理天然解决了这一难题,通过构建智能体操作系统,让开发更加简单,将AI分配的任务直接接入高性能的云端环境。它不仅自带MCP(模型上下文协议)工具和环境,还能在云端轻松完成任务执行、算力弹性扩容,全程可视化,让运行时间大幅“瘦身”。

  就像互联网催生App生态,云端环境支持弹性算力,有丰富的生态,可以便捷部署,开发者可以“拎包入住”。传统的操作系统分成基础层、内核层、用户界面层。我们认为只有这样分层,不同的公司根据自己所长研究不同的层,才能改善智能体开发遇到的问题。

  具身智能最新能力是焦点

  大模型与机械的融合,让机器人从预编程机械臂进化为能感知、会思考的具身智能体,传统机器人的产业格局正被重塑。2025年,具身智能的代表形态人形机器人收获了极大的关注度,超150台人形机器人亮相2025 WAIC,落地情况、最新能力等是关注焦点。

  商汤科技董事长兼CEO徐立

  机器人要看懂、会懂、能交互

  人工智能发展的下一阶段是去跟世界交互,一是跟世界交互可以获得更多的数据,人类从小的学习方式就是先跟世界做交互;二是人工智能要真正成为生产力,需要走进实体的世界中。

  也就是说,人类的学习天生是多模态的,多模态能够解决生产力工具和交互工具的问题,多模态对于世界的理解赋能了具身智能行业,具身智能的核心是大脑,即VLA(视觉语言动作模型),世界模型可以很好地帮助机器人和世界交互。

  视觉感知让机器人识别和理解世界万物,视觉导航可以做路径规划,基于规划自主导航,交互也非常重要,机器人会经历从交互工具到交互伙伴的演变,可以调试机器人的风格,可以回答、被打断,可以进行全局记性、随时交互。

  梅卡曼德创始人兼CEO邵天兰

  下一个风口是“能干活”

  “硅基生命”正通过AI智能终端、智能网联汽车、智能机器人等多元形态快速融入社会。两三年前,大家还在热衷于比拼自己的技术炫不炫酷。去年以来,大家开始转向考虑如何结合场景落地应用的问题。今年更明显的感受是,行业不约而同地聚焦落地应用,思考怎样实现具身智能与场景相结合,让场景结合时更安全、高效、可靠等问题。“能干活”,是具身智能下一步要干的事。

  比如钣金件是汽车制造中的重要零部件,应用于车身结构件、覆盖件和功能部件等。梅卡曼德的AI视觉系统能够应对钣金件反光、异形、乱序堆叠等复杂工况,在大于3米的距离下精准识别钣金件及其关键特征,视觉精度达±0.5毫米。AI视觉引导钣金件深筐无序上料是真实的应用场景,智能筐内路径规划+抓取规划,能有效应对深筐、工件贴边/贴角等问题,提升深筐抓取成功率及清筐率。如果没有真实的落地,一切技术只是想象。

  XREAL联合创始人吴克艰

  和智能眼镜结合是必然趋势

  眼镜有便携性,可以连接互联网、操作App,但眼镜不能在现实生活中充当劳动力,这部分工作可以由具身智能来提供。

  眼镜还可以实现视觉反馈,有了视觉反馈,就可以向人类实时推送一些信息,比如视觉影像、定位等。为什么现在具身智能这么火?是因为人工智能赋能机器人,可以让机器人替人类去做更多事情。眼镜可以解决人与人、人与具身智能交互的问题,人类也可以通过智能眼镜操控具身智能。

  只要眼镜和具身智能联网,有些功能已经可以实现,前提是具身智能落地到实际场景。不过技术转化成产品,并且真正被社会接受,需要一定的过程。

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
验证码