假如现在的 AI 助手还停留在“你问我答”的文字聊天阶段,那它可能很快就要像当年的功能机一样过时了。
最近一周,蚂蚁集团旗下的全模态通用 AI 助手“灵光”,其在应用商店的霸榜表现,给整个行业提了个醒 —— 用户的胃口变刁了。
作为业内首个移动端实现“全代码生成多模态内容”的产品,灵光的三大核心功能 —— 对话、闪应用、开眼,试图通过可视化的叙事语言、更友好的信息呈现、更低门槛的 AI 创作,重新定义 AI 大模型的效率标准。
这恰恰证明了: 在算力内卷的尽头,用户与 AI 的交互深度,或许是下一个赛道的胜负手。
数据显示,“灵光”正式上线仅 4 天,下载量突破 100 万,这一速度快于 OpenAI Sora 的 5 天;上线 6 天, 下载规模更是迅速突破 200 万,远超 ChatGPT 首周的 60.6 万。
在“百模大战”进入深水区、用户对同质化产品逐渐产生疲劳的当下,一款新 AI 应用能跑出这样的加速度,本身就值得研究。
抱着试试的心态,IT之家就下载并深度体验了一番。
用完之后的感受,用一句话总结就是: 它终于不再想做一个“聊天机器人”,而是想做一个懂“审美”、有“眼色”的超级助理。
01.
别让 AI 只是“堆文字”,让它“动态演示”
长期以来,我们习惯的 AI 交互界面是单调的:线性的文字问答,加上灰色的对话框。这种形式在处理简单信息时效率尚可,但面对复杂知识时,极易引发“文本疲劳”。
所以,灵光在体验上最大的差异化,在于它试图“让回答活起来”。
比如,当IT之家询问“兵马俑真实身高,是如何发现的”或“金字塔 / 比萨斜塔构造”这类问题时, 灵光并非简单的图文罗列,而是直接生成了可旋转、可缩放的 3D 数字模型。
你可以通过手指的交互,直观地从不同角度观察细节。这不仅是视觉上的升级,更是认知效率的提升 —— 对于空间感强的知识,一看便知,远胜千言。
如 GIF 所示,当静态答案转化为可交互 3D 模型的瞬间,知识便突破了平面呈现的局限,以立体形态出现在用户眼前。
通过手指的拖拽与交互,用户可以从不同角度观察模型的细节,让诸如古文物建筑这种空间感极强的信息,瞬间变得直观可感。
正如上文所述, 这是一种“让知识活起来”的体验。
这种视觉化能力 不仅限于 3D 模型。
在查询财报或研究论文时,灵光会生成可视化的图表与数据,让复杂数据一目了然;
在规划旅行路线或探店时,它会直接生成可交互的地图,清晰展示路径与动线;
甚至在面对“量子纠缠”或“经济学原理”等抽象概念时,它还能通过生成式插图、动画,甚至是小应用,将晦涩的理论化繁为简。
02.
逻辑的「秩序美学」
除了视觉上的冲击,灵光解决的第二个痛点,是“逻辑混乱”。
大家平时用 AI 写东西或者查资料,最怕那种“车轱辘话来回说”的情况,看着挺长,其实没啥干货。
为了测灵光的逻辑,IT之家向灵光抛出了一个典型的复杂深度议题:“人口老龄化将如何重塑未来的消费结构?”
面对这类既需要宏观视野、又涉及微观分析的社会经济学问题,灵光的处理方式令人印象深刻:
它并没有直接堆砌文字,而是像一个专业的 PPT 设计师或者杂志编辑那样,把界面排版得清清爽爽。
最终呈现在屏幕上的,是一组因果清晰、逻辑递进的解释结构。
它采用“标题 + 概括卡片”的风格,镶嵌在一个完整的图文流中。
这种结构化输出,不仅让信息的逻辑链路一目了然,更模拟了专家型写作者的内容组织方式。
甚至 —— 自媒体拿来当文章都不是问题。
在这个信息爆炸的时代,我们有时候缺的不是信息, 缺的是“把信息整理得赏心悦目”的能力。这一点,灵光真的拿捏了。
接下来的测试中,IT之家又换了一个更接地气的问题,也进一步验证灵光对时效性热点和复杂信息的梳理能力。
IT之家结合了一个刚刚发生的科技圈热点:前天高通刚刚发布了第五代骁龙 8 处理器。
不得不吐槽的是,近两年来高通骁龙芯片的命名确实让人“摸不着头脑”:从 8s、8、8 Gen 到 8 Elite(至尊版),各种后缀层出不穷,别说普通消费者,就连很多数码老玩家看一眼都得愣神。
面对这种典型的“参数迷宫”,我们直接把一个最容易混淆的问题抛给了灵光 —— 刚刚发布的骁龙 8 Gen5 处理器与第五代骁龙 8 至尊版是什么关系?配置规格、跑分呢?
如上图所示,灵光给出的回答相当清晰, 它没有简单地罗列枯燥的型号列表,而是展现了强大的逻辑重组能力,比如核心定位速览,瞬间厘清了两款产品的代际与定位关系。
针对性能疑惑,它直接调取并展示了详细的跑分对比图表,用数据直观呈现了两者的性能差距。最后,它清晰地告诉你两者的核心差异,甚至给出了选购建议。
再抛给灵光一个“刁钻”的跨品类对比题:
“享界 S9T(增程版)和奥迪 A7L,以及坦克 500 Hi4T 版本,这三款车,按照每年行驶一万公里,综合对比一下后期养车成本。”
这是一个典型的“关公战秦琼”问题:享界 S9T 是新能源轿车,奥迪 A7L 是传统豪华燃油,坦克 500 Hi4T 则是硬派越野插混。三者的能耗逻辑、保养周期、保险费用完全不在一个维度,普通人要想算清楚这笔账,得翻阅大量资料并手搓 Excel。
灵光给出的回答,则给出了“账单式”条理性 —— 没有甩给我一大段文字描述,而是直接生成了一份结构化的成本对比清单:
能耗拆解:它精准区分了三车的能源类型,将享界的电费 / 油费、奥迪的燃油费、坦克的混动油耗分别计算,并统一折算为“万公里能耗成本”。
维保预估:它调取了不同品牌车型的保养标准,清晰列出了小保养与大保养的预估费用差异。
总账一览:最后,它直接给出了一个年度总支出对比,用图表形式直观展示了三款车在持有成本上的高低阶梯。
所以,这种感觉怎么形容呢?
以前用 AI,感觉是在跟一个“学霸”传纸条,懂挺多,但只能写字。
现在用灵光,感觉是雇了一个 “全能多媒体专家”,能画图、能建模、能做表,想尽一切办法让你“秒懂”。
说白了就是: 别让用户读字,让用户“看”答案。
最后再提一嘴“灵光闪应用”功能,如果说上面是“看”,那么这个就是真的在“玩”了。
简单说,就是你可以通过跟它聊天,让它在 30 秒内给你写出一个独立的小应用。
IT之家手痒试了一下。
笔者对灵光说:“帮我做一个厨房计时器”。
随后,果真就在几十秒内,一个可以点击、交互、有动画效果的厨房计时器应用就弹出来了。
再比如,笔者让它做了一个年会抽奖机,说好需求后,几十秒内,一个清爽又高效的小应用就做出来了。 你的指令越精准,它最终呈现的效果就越惊艳。
当然,制作的时间也会更久一些。
另外,你制作的应用还可以保存、分享给好友(网页),好友打开链接就能直接用。
还是要强调一下,目前该功能主要面向逻辑简单的轻量级应用,但它也确实让笔者这样不懂代码的普通用户, 真正体验到“所想即所得”的创造乐趣。
03.
写在最后
回到文章最开始。
灵光上线首周的表现,6 天 200 万下载量的背后,其实反映的也是消费者对高质量、差异化 AI 产品的渴望。
蚂蚁灵光的实践通过了市场验证:AI 的赛道,正在从单一的“模型算力内卷”,转向“交互体验与信息呈现”的综合维度较量 ——
用 3D 和图表消灭了枯燥的文字流;
用策展式排版消灭了逻辑的混乱;
用 30 秒生成 App 消灭了创造的门槛。
事实证明,我们不仅需要更聪明的 AI, 更需要一个更好用、更好看、也更懂我们的 AI。
如果你也厌倦了对着冷冰冰的对话框互发文字,不妨去应用商店下载灵光试一试,不用太复杂,你就把他当个无所不知的老朋友,先问个最朴实无华的小问题来热热身 ——
比如,“你好,请教一下光刻机该怎么造?”返回搜狐,查看更多