评论

王小川谈大模型价格战:吃瓜看热闹,不掺和;背后是推理成本下降

出品 | 搜狐科技

作者 | 梁昌均

“吃瓜看热闹,对我们而言,就是别掺和进去。”在5月22日的媒体沟通会上,百川智能创始人兼CEO王小川对最近的大模型价格战显得格外淡定。

近日以来,字节、阿里、百度、腾讯等大厂先后宣布主力模型API调用价格大降价,有的甚至直接免费。王小川认为,这反映了大家对AI前景的看好,宁愿免费也要入场。

同时,他也强调称,是否降价核心要看商业模式,API服务对创业公司走不通,因此降价仅限于云服务厂商的动作。

“这个事情也挺熟悉,之前四小龙做ToB的时候也是这样,有限场景打价格战。”王小川表示,大厂最后都会卷这件事,没想到这么狠,这肯定是大厂射程范围内,但已经走出创业公司的射程。

他还认为,这波大模型价格战跟此前的千团大战、网约车大战有本质不同。原来的互联网价格战或补贴,商业模式改变的是生产关系,更多是C端的价格竞争,而这次是在B端,改变的是AI生产力供给。

对于大模型价格战对行业的影响,王小川表示,这会刺激整个ToB市场更快繁荣。“价格战会使得泡沫变得更加繁荣,并不是没泡沫就是好的状态。”

除了能加快应用,王小川对搜狐科技表示,价格战背后也有推理成本下降的因素,其由技术进步导致。“我相信大厂也预期未来模型成本会降低特别多,也许今天亏钱,再过一年不亏钱,这种情况下,大厂商并不会考虑短期亏损的问题。”

同时,王小川表示,随着越来越多的开源和低廉成本的闭源模型,每个厂商要更清楚自己的定位,要让市场变得更加理性健康。“之前大厂很恐慌,现在好很多,到现在这个阶段,会有一些没想清楚的公司退出去。”

对成立一年多的百川智能来说,已明确了自身定位——超级模型+超级应用双轮驱动。此次发布会上,王小川正式推出上千亿参数的最新一代基座大模型Baichuan 4,并推出首款C端AI助手“百小应”,其核心能力是懂搜索、会提问。

在国内大模型评测机构SuperCLUE的评测中,Baichuan 4模型能力国内第一,在知识百科、长文本、生成创作等文科类中文任务上优于GPT-4turbo、Claude3、Llama-3等国外大模型。

在媒体沟通环节,除了颇受关注的大模型价格战,王小川也对大模型未来的技术趋势、C端应用和商业模型等问题进行了回应。他认为,现在还没有谁做出超级应用,谈商业模式为时尚早。

谈价格战:仅限于云厂商的动作,推理成本下降是技术推动

媒体:怎么看巨头大模型大降价?百川怎么应对?

王小川:大家太看好AI前景,不愿意失去任何机会,宁愿0价格也要入场。核心要看商业模式,如果是做ToB服务,降价最后卖的不是模型本身,卖的是整套云服务,所以降价仅限于云服务厂商的动作。

API服务在中国而言对创业公司是走不通的,中国商业环境里ToB比ToC少10倍,且创业公司做ToB收的是人民币,花的是美金。最后大厂都会卷这件事情,没想到大家这么狠,都卷到0了,这肯定是大厂射程范围内。但对创业公司而言,已经走出他们的射程。

我现在确实是吃瓜看热闹的心态,你们比我还焦虑。API不会构成我们收入重点,对我们而言,就是别掺和进去,现在跟我们没啥关系,我们的超级模型也不是对外服务。但一定要做差异化,所以战略上更坚定走双轮驱动的模式。

媒体:有观点认为,大模型价格战会让国内ToB商业模式彻底失效,或者天花板拉得更低,你怎么看?ToB还能赚钱吗?

王小川:我觉得就像原来的滴滴美团,着会刺激整个ToB市场更快繁荣,大家会更愿意尝试使用,有价值空间,只是看被哪个公司赚走了。

涨潮退潮最后才会有珍珠,一定有泡沫在里面,价格战会使得泡沫反而变得更加繁荣,并不是没泡沫就是好的状态。在之前的泡沫里面,很多公司觉得自己得去训模型,这是不健康的,市面上不需要那么多的模型提供方,不需要千模大战、万模大战。

随着有越来越多开源和低廉成本闭源模型,每个厂商要更清楚知道定位,到底是做应用还是自己做模型,还是模型应用一体化,会让大家更加理性。之前大厂很恐慌,现在好很多,尤其是大厂这么做贡献,会使得ToB应用繁荣得更快,但会有一些没想清楚的公司退出去。

媒体:价格战背后也有成本下降的因素,应用还没起来成本就下降的原因是什么?

王小川:推理成本是否下降跟用户规模没有什么关系,更多还是技术的进步,包括底层GPU,算子层、infra的建设和模型联动。模型能力不是说有用户能提升,没用户不提升,技术使得成本下降,性能提升,而且是指数级的变化。

我相信大厂也预期未来模型成本会降低特别多,也许今天亏钱,再过一年不亏钱,这种情况下,大厂商并不会考虑短期亏损的问题,而是考虑未来预期有没有机会模型降到足够的便宜。

媒体:除了打价格战,营销战也挺猛,有些UP主说接广告都接不过来,百川会不会有类似的打法和策略?

王小川:可能不太一样,我知道有的企业为了获客,1个用户200块钱,还不说获客之后提供服务的费用,有些人也对今天大模型的部分厂商蛮有质疑。我觉得这只是竞争过程中,为了能赶快拿下一轮融资的举动,并不是健康的行为。百川有足够资金,不是通过发一个东西去拉下一轮融资,我们会走得更健康一些,会把精力聚焦在产品价值。

谈超级应用:整个行业还没成熟,ChatGPT也不算超级应用

媒体:现在市面上C端应用很多,百川现在发百小应,会不会有点晚?

王小川:我正好觉得相反,发早了,今天大模型应用还需要更多时间的打磨。今天一个百万级的DAU,还远远称不上超级应用,之前发的各种应用只是模型的展现,各家都还没做出超级应用。这次发布的“百小应”离我们心中要的也还有距离,但我们也需要有机会把它发出来,让行业端有基础的了解,也能让团队转起来。所以不是早不早的问题,是整个行业都还没有到成熟的状态。

媒体:如何定义超级应用,是不是要有上亿用户,预期是怎样的?

王小川:超级应用我认为要满足刚需,规模上还得再提升两个数量级,从100万DAU变成1亿,上浮下浮3.3倍,得到三千万到三亿之间,我觉得这个叫做超级应用。

ChatGPT我觉得还不算超级应用,如果OpenAI足够用心,超级应用它能做,以它现在的技术有机会,但它有自己的基因,没有往产品方向投入太多精力。

从超级应用角度看,现在大家都没有到,但我们自己心中有这个画面感。这一年的时间,团队本身有足够的手感,也做过超级应用,所以对未来长什么样子有一个期盼。发了这个之后,节奏感上可以真正走向双轮驱动的模式。

媒体:此前有观点不太看好同时做模型和做应用的创业公司,百川为什么要双轮驱动?

王小川:我的基本判断,同一代模型,百川更有机会把超级应用做出来,并能做到最好。超级应用要在模型有一定提升之后才能做出来,我们也有自己应用端的储备。

每一家选择的路径不太一样,有的是先把模型拱起来,也有的是去做应用。上海有家做模型跟应用做成两个公司,我觉得可能会出问题。模型和应用平衡,是每家公司最顶层战略要考虑的问题。模型是模型,应用是模型,模型做大了不代表应用做好。

媒体:百小应想要成为超级应用,应该具备什么样的特点,应该切中用户什么样的诉求?

王小川:首先可靠性得高,在可见的未来里一定要跟搜索做结合。模型是推理引擎,有了搜索之后,能使得它的知识广泛程度和真实度能得到提升。

第二块是能跟你对话,有充分理解你意图的能力,像你的助理一样能很清晰知道你要什么。超级应用再往下走,要让模型能变得足够可用的话,我认为首先能突破的点是变成职业人士。AI要像人一样工作和学习,这是AI发展的路径,最后就会变成一个职业人士。

谈商业变现:API和模型收费不是最性感的模式,现在谈赚钱意义不大

媒体:关于C端的商业模式,除会员、广告等外,AI应用的商业模式是否会有本质区别?

王小川:我觉得现在谈商业模式过早,包括Kimi,现在有足够的用户价值,有足够的体量,不管是走流量模式,还是广告模式都会有意义。现在这种探索没问题,但我觉得有或没有,其实没有本质区别。

媒体:ChatGPT、文心一言都有收费版本,百川未来会不会走类似的变现路径?

王小川:这不在我们考虑当中,文心一言,我觉得它还没有百度文库的收入多。今天API和模型本身的收入,都不叫成功实践,不是我们要追赶和类比的情况,在今天也不是最性感的商业模式,文心一言和ChatGPT都不是。

关键是要有超级应用,解决用户的痛点,然后收入来讲,我持毫无疑问乐观的状态,但现在谈收钱这件事情好像意义确实不大。

媒体:你觉得Kimi的打赏功能怎么样?打赏之后下一步会是什么?

王小川:我觉得挺好,这是正确的商业理念,能筛选出非常明确的有付费需求的AI应用用户。往下我觉得商业是跟着产品价值走,价值到了之后,打赏付费能起来,否则再怎么规划场景也没用,用户都不用。

谈技术瓶颈:Sora和GPT-4o不代表最大突破,多模态还没有智力

媒体:现在国内外公司在大模型技术方面是否遇到更大瓶颈,前沿探索是不是更难了?

王小川:在模型探索当中,从0到1的突破,美国从资金储备、科学家的文化来看,比国内强很多。可以说每一次重大的技术突破都是美国引领,我们再去跟,能使我们大大降低成本的投入,能把精力更多放到怎么能把用户端做好,所以在国内的区别是需要做平衡。

大模型的瓶颈,至少在我心里,Sora和GPT-4o不代表最大的突破,传说中的GPT-5也许也有一些delay的东西,年底才能看得出来。

媒体:国内都在拼文本,长文本卷到无限长以后,还有什么方向可以发展?

王小川:今天模型自洽性不够,模型思考的严谨性,足够好的逻辑,都是更加重要的事。我不觉得长文本是唯一的事情,它只是做大的必要条件,不是充分条件。在充分条件里,我认为模型本身要更强调内在的自洽性和推理能力,这两件事情并不是能靠长窗口去解决。

媒体:百川未来在多模态上有什么样的规划?

王小川:相比多模态,百川更关注于文本能力,我觉得多模态还没有智力。这次大模型主要是语言智能的突破,感知和认知。符号本身就是对世界建模的过程,且已经尽可能把人类对世界的认知积累下来,语言在这里面就是对世界进行类比的过程,是认知过程本身。

但今天语言用着用着可能没数据了,开始探索能否在图像、视频里面产生智能。今天在学术界也都没有跑通,机器还没有足够智能,能自动发现规律,因此语言基本和智力是等价的概念。包括AlphaGo、Stable Diffision,都是对世界规律的复现,不是代表智力认知活动。

媒体:怎么看AI或者生成式AI给搜索带来的机会?百川如何做AI+搜索?

王小川:搜索在国内外不一样,国外Google绝对是老大哥,国内百度是不断被抢份额的状态。AI发展之后,大的趋势,我觉得依然存在百度搜索被抢份额的状态。如果只是做搜索2.0,只是用模型对搜索做总结,我觉得这件事情的价值创造和竞争力,走不出大厂射程。

对我们而言,需要两件事情都做,自建搜索能力,同时也得有数据能力。技术成本相对可控,现在最大的成本是Scale Up,大模型实验加上Scale Up,远大于其他地方。返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读