人工智能酝酿下一个爆款

频道：热点快讯日期：2025-07-30 08:16:08 浏览：3

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

　　来源：北京商报

　　7月的最后一个周末，2025世界人工智能大会（WAIC）吸引了800多家企业参加，宇树人形机器人跳舞、格斗的画面登上多家媒体头版C位，智能眼镜展台排队体验的观众拐了好几个弯。同时举行的100多场论坛中，“智能体”成为高频词，智能体与大模型的关系、智能体的落地路径，从业者一边分享方法论一边观点碰撞。

　　“能思考会做事”，不管是线上应用还是具身硬件，2025年的AI以实用为目标。2025 WAIC期间，北京商报记者与科技大厂、智能硬件、垂直赛道等领域高管进行了交流，通过他们的视角，一条人工智能发展的脉络逐渐清晰。当观众们为钢铁之躯按下快门，更新了植入智能体的新版App，下一个行业爆款的种子已悄然埋下。

人工智能酝酿下一个爆款

　　智能体与大模型不可类比

　　大模型基础能力的成熟，让智能体以极快的速度成为标配，大模型的风头似乎要被取代。事实上智能体与大模型不可类比，前者是应用范畴，后者属于基础底层技术支持，toC（用户）智能体与toB（企业）智能体的打造逻辑也不尽相同。

　　腾讯云副总裁吴运声

　　不会“昙花一现”

　　简单用“放大”或“缩小”大模型的价值来定义智能体不合适，智能体实际上是大模型技术落地在具体行业、产生价值的一个重要形态。

　　大模型最终是要落地解决问题的，这个过程会出现很多问题。我们需要思考用什么形态、什么解决方案去解决，智能体就是一个很好的形态。

　　我认为这种智能体形态不会短期存在，会是长期的。因为它（智能体）能自动思考、决策、进行环境感知、选择工具，甚至能自动创造工具再进行工具调用，出现了一些崭新的、大模型原生时代所体现的应用特点。智能体和行业大模型也不是取代的关系，我们的目标始终是用技术服务产业，无非是通过怎样的方式去服务。

　　想要达到智能体什么都能干，并且能干得很好的理想状态，需要模型、工程、框架、性能调优、数据等全环节高速发展。这会是一个长期迭代发展的过程。

　　金山办公助理总裁田然

　　只对接API远远不够

　　AI必须和软件做深度的融合才能提供最佳的用户体验。比如办公场景，融合不是简单地给软件的1万个API（应用程序编程接口）“教给”AI，一方面API学不会，它没法学习经过大量训练的网络信息，它有自己的编程语言。把流程反过来，从AI到API也不行，AI没办法把自己真正擅长的写进文档里，方便用户去做增减项。

　　现在AI办公正在向Agentic Software（代理式软件，即更强大更智能的软件）演进，从业者要做的是针对场景做AI和软件的双向改造，AI软件化的改造是指教会AI用软件，要用一套专门为AI设计的API，软件也要为AI设计专有的能力，最终依靠用户、软件、AI之间多轮交流，输出真正可用的内容。

　　技术层面之外，产品可以以助理的形式设计，允许用户跟AI持续讨论，产出想要的内容，这样可以大幅降低大众使用AI的门槛，行业将迎来“人人都有AI助理”的时代。

　　阿里云无影总裁张献涛

　　需要“拎包入住”的开发环境

　　本地设备就像一位“蚂蚁搬家”的苦力，难以支撑高并发、高算力需求的智能体任务，尤其是需要大量GPU（图形处理器）运算的工作，普通办公电脑根本“hold不住”。同时，智能体执行任务时往往会占用本地计算资源和操作权限，严重影响体验。

　　云电脑的技术原理天然解决了这一难题，通过构建智能体操作系统，让开发更加简单，将AI分配的任务直接接入高性能的云端环境。它不仅自带MCP（模型上下文协议）工具和环境，还能在云端轻松完成任务执行、算力弹性扩容，全程可视化，让运行时间大幅“瘦身”。

　　就像互联网催生App生态，云端环境支持弹性算力，有丰富的生态，可以便捷部署，开发者可以“拎包入住”。传统的操作系统分成基础层、内核层、用户界面层。我们认为只有这样分层，不同的公司根据自己所长研究不同的层，才能改善智能体开发遇到的问题。

　　具身智能最新能力是焦点

　　大模型与机械的融合，让机器人从预编程机械臂进化为能感知、会思考的具身智能体，传统机器人的产业格局正被重塑。2025年，具身智能的代表形态人形机器人收获了极大的关注度，超150台人形机器人亮相2025 WAIC，落地情况、最新能力等是关注焦点。

　　商汤科技董事长兼CEO徐立

　　机器人要看懂、会懂、能交互

　　人工智能发展的下一阶段是去跟世界交互，一是跟世界交互可以获得更多的数据，人类从小的学习方式就是先跟世界做交互；二是人工智能要真正成为生产力，需要走进实体的世界中。

　　也就是说，人类的学习天生是多模态的，多模态能够解决生产力工具和交互工具的问题，多模态对于世界的理解赋能了具身智能行业，具身智能的核心是大脑，即VLA（视觉语言动作模型），世界模型可以很好地帮助机器人和世界交互。

　　视觉感知让机器人识别和理解世界万物，视觉导航可以做路径规划，基于规划自主导航，交互也非常重要，机器人会经历从交互工具到交互伙伴的演变，可以调试机器人的风格，可以回答、被打断，可以进行全局记性、随时交互。

　　梅卡曼德创始人兼CEO邵天兰

　　下一个风口是“能干活”

　　“硅基生命”正通过AI智能终端、智能网联汽车、智能机器人等多元形态快速融入社会。两三年前，大家还在热衷于比拼自己的技术炫不炫酷。去年以来，大家开始转向考虑如何结合场景落地应用的问题。今年更明显的感受是，行业不约而同地聚焦落地应用，思考怎样实现具身智能与场景相结合，让场景结合时更安全、高效、可靠等问题。“能干活”，是具身智能下一步要干的事。

　　比如钣金件是汽车制造中的重要零部件，应用于车身结构件、覆盖件和功能部件等。梅卡曼德的AI视觉系统能够应对钣金件反光、异形、乱序堆叠等复杂工况，在大于3米的距离下精准识别钣金件及其关键特征，视觉精度达±0.5毫米。AI视觉引导钣金件深筐无序上料是真实的应用场景，智能筐内路径规划+抓取规划，能有效应对深筐、工件贴边/贴角等问题，提升深筐抓取成功率及清筐率。如果没有真实的落地，一切技术只是想象。

　　XREAL联合创始人吴克艰

　　和智能眼镜结合是必然趋势

　　眼镜有便携性，可以连接互联网、操作App，但眼镜不能在现实生活中充当劳动力，这部分工作可以由具身智能来提供。

　　眼镜还可以实现视觉反馈，有了视觉反馈，就可以向人类实时推送一些信息，比如视觉影像、定位等。为什么现在具身智能这么火？是因为人工智能赋能机器人，可以让机器人替人类去做更多事情。眼镜可以解决人与人、人与具身智能交互的问题，人类也可以通过智能眼镜操控具身智能。

　　只要眼镜和具身智能联网，有些功能已经可以实现，前提是具身智能落地到实际场景。不过技术转化成产品，并且真正被社会接受，需要一定的过程。

[上一篇]央企8年后重回百家折射重组逻辑之变

[下一篇]多地发放算力券“红包” 促进人工智能赋能千行百业