主角:受Kimi的影响,百度的文心一言和阿里的通义千问,用户访问量大幅下降,降幅分别达到33.42%和45.05%。

01 此消彼长

Kimi自问世以来,一直在“吊打”国内各大厂商的AI模型。

Kimi“颠儿了”以后:国产大模型危机感重重  第1张

据券商监测数据显示,截至3月25日,Kimi网页端、APP端用户DAU(Daily Active User,日活跃用户数量)突破历史新高,分别达到79万和54万。加上小程序用户数量,全端总DAU明显超过225万,或者已经超过百度。(BIDU.O/9888.HK)其大模型文心一言233万。

而且半个月前,3月10日,Kimi的全端DAU刚刚超过120万人。但是事实上,早在2月份,Kimi的用户访问量就达到了305万,比1月份翻了一番。

同时,百度的文心一言和阿里(BABA.N/9988.HK)该公司拥有通义千问两大TOP2玩家,用户访问量大幅下降,降幅分别为33.42%和45.05%。

Kimi的一举一动也受到了大厂的关注和模仿,数据屡破新高。

Kimi是月亮暗面推出的对话AI产品。三月十八日,月亮暗面宣布Kimi支持上下文输入200万字。而且在半年前,去年十月发布的时候,Kimi可以支持的无损上下文输入长度只有20万字。

所以,大型模型的“长文本能力”也受到大型企业的重视,甚至被认为是大型模型竞争的重要性能指标。

三月二十二日,通义千问升级,免费向所有人开放。 1000 万字长文档处理功能;360智能大脑正式测试500万字长文本处理功能,即将入驻。 360AI 浏览器。

文心一言也宣布将于四月升级,届时还将开启长文本能力,预计文本范围将达到200-500万。

据笔者了解,很多业内人士并不看好这些大厂商的“东施效”。他们认为Kimi在长文本领域的领先地位并不是那么容易被超越的。

也许正因为如此,今年2月,阿里作为月亮黑暗面最新一轮融资的领导者,投资额度的70%到80%被算力服务所取代。

02 灵魂kimi

互联网公司,专注于各个领域的顶尖技术人才,但是像Kimi这样的“明星员工”却很少。

月亮暗面创始人杨植麟,是Kimi团队的灵魂人物。本人是长文本领域的专家,有清华和卡内基梅隆的背景。

自研语言处理在过去五年内进行。(NLP)杨植麟在该领域有相当大的影响力。杨植麟的学术论文在中国学者引用排名中排名前十,在40岁以下排名第一。

在攻读博士学位期间,杨植麟以第一作者的身份发表了Transformer-XL和XLNet两项工作,在谷歌学术界引用了近2万次,并在当时的多项NLP任务中取得了最佳效果。

Transformer-XL已经成为第一个全面超越RNN的注意语言模型,而XLNet在20个顶级会议中获得了最佳论文提名。

杨植麟和他的团队创造了Kimi优秀的无损压缩技术。该技术可以减少参数对存储的需求、推理的计算能力和数据传输的带宽占用,从而高效、无损地处理百万级长Token。

而且为快速赶上长文本热潮,其他大厂只能退而求其次,选择检索增强生成RAG技术。

Kimi无损长上下文窗口的解决方案是在逐字阅读全文后给出答案。RAG技术是检索和生成全文关键信息的答案,但一些关键信息可能会丢失。

所以,与前者相比,无论输出的深度还是精度,大厂的模型都存在着较大的差距。

目前,Kimi还没有公布无损压缩技术的细节。除了论文,学术界还没有太多的开源内容可以参考。大工厂想“学习”、而且工程化是很难的。

除了技术,Kimi的策略也值得思考。

为了快速“跟上形势”,大厂一上手就追求花哨的多模态,导致“一切都松”走向平庸。

而且Kimi选择“一击必杀”——首先垂直选择打透长文本领域,以培养用户的心智,积累用户留存。

自发布以来,Kimi在指令理解、信息检索能力、模型相应速度等方面不断迭代,除了将上下窗口从最初的20万字扩展到200万字。

月亮暗面内部人士介绍,基于Infra层的优化,Kimi的生成速度比去年10月提高了三倍。

Kimi用户在2023年12月、今年1月和2月分别保留了18.48%、22.25%和23.36%。这一高粘性,同时形成正反馈。

在使用过程中,用户会自发地“喂”Kimi许多专业语料材料。Kimi通过不断学习和处理各种语料材料,可以更好地理解和适应不同的语境、问题和需求,从而提高其性能和准确性。

Kimi在这种专业语料处理方面的进步速度比OPEn快。 AI。

因为,现在Open, AI仍然限制C端用户上传文件。对于Kimi用户来说,他们亲自培养了一个学习能力很高的免费私人助手,并继续互动。

03 海外市场的加码

正如马斯克最近发言的那样,升级技术路线的方法,并非与竞争者相比,那就太简单了。应该是不断地挑战物理极限。

Kimi“颠儿了”以后:国产大模型危机感重重  第2张

超越百度等大工厂,也许不是Kimi的目标。随着下一步的扩张,月亮的暗面指向海外。

目前,月亮的暗面正在招聘国内/国外效果广告设计师。除了国内广告平台的设计,这个岗位还需要承担公司产品在国外各大广告平台的责任,比如谷歌。Meta,广告创意设计,如Tiktok。

Kimi“颠儿了”以后:国产大模型危机感重重  第3张

与此同时,月亮的暗面也在弥补操作的不足。

月亮暗面技术团队只有100多人,是国内领先的大型模型公司之一,人数最少。包括安卓工程师、测试、市场、人力等。,都是公司正在招聘的职位。

以产品增长岗位为例。该岗位要求具有大厂工作经验,善于通过社交媒体和用户裂变策略推动产品增长,包括拥有从0万到1000万用户增长的经验,专注于增加活跃用户数量和长期留存率。

"打不过就加入"。对Kimi的崛起,阿里虽然有自己的通义千问,但也给予了支持。

现在,Kimi借调了阿里的英伟达(NVDA.O)A800以及A100 GPU处理器型号扩展,未来Kimi算力侧的支持,也将主要来自阿里。

今年2月,阿里作为投资领导者,在最新一轮月之暗面投资超过10亿美元时,其投资额度的70%至80%将被计算能力服务器取代。

在阿里的支持下,Kimi不用担心因为计算能力不足而停机。这位人士还说,扩张不是一步到位的。如果一下子扩展太多,很容易导致计算能力的闲置和浪费,这需要一定的策略。例如,Kimi也会预测用户的使用情况。

自ChatGPT于2022年11月发布以来,我国已有200多个AI模型,而且还在不断增加。Kimi的出现,唤醒了行业巨头的危机意识。

但是Kimi也不是这个技术竞赛的终点。(来源:AI新智能)