月之暗面:长文本大模型的AI独角兽

时间:2024-07-12 15:44 栏目:创新发展明星秀 编辑:投资有道 点击: 599 次

在人工大模型领域,月之暗面(Moonshot AI)在今年异军突起,4月份Kimi智能助手网页版访问量达到2004万,同比上涨60.2%,5月份的访问量超过2300万,连续两月超过文心一言成为国内同类产品的第一位。

这家AGI(通用人工智能)创业公司成立于2023年3月,在今年3月,Kimi智能助手无损上下文长度提升到200万字,成为AGI领域的“香饽饽”,红杉中国、真格基金、今日资本、阿里以及腾讯等各类资金“押宝”月之暗面。

月之暗面创始人杨植麟表示,衡量一个AI产品的长期价值在于用户愿意在其上输入多少个人化的信息。建立用户信任是关键,最终效果应该是用户和AI成为朋友。他相信AGI最终是全球化的,未来AI能力的提升会领先于产品的破圈。一个应用的上限体现在以年为维度的AI和人的连接的增加。

超长文本AI

6月20日,月之暗面官微表示,Context  Caching即将启动内测,让每个开发者都用得起长文本大模型。

Context Caching(上下文缓存)是由Kimi开Tokens内容,有效降低用户在请求相同内容时的成本。Context Caching特别适合用于频繁请求、重复引用大量初始上下文的情况,通过重用已缓存的内容,显著提高效率并降低费用。

月之暗面称,Context Caching的应用场景包括:提供大量预设内容的QA Bot,针对固定的文档集合的频繁查询(如上市公司信息披露问答工具),对静态代码库或知识库的周期性分析,瞬时流量巨大的爆款AI应用,交互规则复杂的Agent类应用等。

超长上下文支持是Kimi的特点和优势。2023年10月,月之暗面推出了首个支持输入20万汉字的智能助手产品Kimi Chat,在今年3月18日,又将Kimi智能助手的无损上下文长度从20万字提升到200万字。

这样的提升让Kimi的访问流量突然猛增。

统计数据显示,Kimi智能助手在2024年1月的访问量为142万,2月的访问量为305万,连续两个月仅次于文心一言和通义千问。不过,自3月20日上午9:30起,Kimi的系统流量异常增高,导致3月Kimi访问量达1218.6万次。4月Kimi智能助手网页版访问量达到2004万,上涨60.2%,访问量已经超过文心一言,排在国内同类产品的第一位。

AI产品榜(aicpb.com)的最新数据显示,5月份Kimi的访问量超过2300万,继续高于文心一言、通义千问等国内同类产品。

据报道,为了达到更好的长窗口无损压缩性能,月之暗面研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走“滑动窗口”“降采样”等技术捷径,攻克了很多底层技术难点,才取得了新的突破。

月之暗面在官微中介绍,过去要10000小时才能成为专家的领域,现在只需要10分钟,Kimi就能接近任何一个新领域的初级专家水平。用户可以跟Kimi探讨这个领域的问题,让Kimi帮助自己练习专业技能,或者启发新的想法。有了支持200万字无损上下文的Kimi,快速学习任何一个新领域都会变得更加轻松。

月之暗面认为,更长的上下文长度可以为大模型应用带来全新的篇章,促使大模型从LLM时代进入Long LLM(LLLM)时代。每个人都可以拥有一个具备终身记忆的虚拟伴侣,每个人都可以拥有一个在工作环境与你共生(co-inhabit)的助手,每个人都可以拥有一个无所不知的学习向导,不仅能够准确地给你提供知识,更能够引导你跨越学科间的壁垒,更加自由地探索与创新。

总之,Kimi可以快速总结分析公众号长文,可以快速完成上市公司财报关键信息分析,可以快速整理多份发票中所需要的信息,发现了新的算法论文时,Kimi能够直接帮你根据论文复现代码,也可以理解网页内容,还可以快速阅读理解整本图书。

5月28日,月之暗面官微披露了许多新的玩法,称Kimi不仅是工具、生产力,还可以用于分析改进人与人之间的关系,可以助力电商创业,扮演电商运营、产品策划、穿搭设计师,可以是自媒体的编导,是律所的神仙实习生,是科研悍匪,是Offer的收割机,等等。

国产AI商业化

月之暗面工程副总裁许欣然表示,Kimi在长文本的技术突破,标志着国内大模型在理解和处理长文内容迈出了重要的一步,为实现大模型更深层次的智能化应用和创新提供了技术支持,加速了AI应用的商业落地。

毫无疑问,Kimi是今年上半年最火的AI产品了。甚至在A股市场,还诞生了月之暗面概念股。

如掌阅科技表示,公司已接入月之暗面旗下的AI对话助手产品Kimi;华策影视称,公司与月之暗面进行了模型接入层面的深度合作;金山办公WPS AI有望接入Kimi长文本大模型,实现产品持续升级;人民网表示其是Kimi内容合规核心合作方、训练数据审核方;海天瑞声称,为Kimi提供数据训练服务。

另外,深信服通过旗下的琥珀资本参与了月之暗面的最近一轮融资。九安医疗是砺思资本的有限合伙人,砺思资本也参股了月之暗面。

如果说2023年是国产大模型快速发展的元年,2024年就是大模型商业化元年。

有报道称,2024年1至4月,国内大模型相关项目中标公告已发布近200个,中标数量远超2023年全年总数。其中,能源、政务、电信成为中标项目最多的三个行业。

事实上,随着大模型长文本处理能力提升,金融、法律、教育、能源、医疗等多个行业有望成为AI技术升级的核心受益者。大模型能够在短时间内快速分析和总结大量工作文件,如合同、报告、会议记录等,帮助员工提取关键信息,减少人工阅读时间,提高决策效率,从而持续提升各行业运转效率。

海通国际的研报认为,伴随国产大模型的持续升级,先进的大模型能力将逐渐转化为落地实际场景的产品应用,Kimi抓住了长文本分析细分领域的“痛点”,这种实际的市场需求,叠加月之暗面自研的大模型在这个领域的领先技术,将使得国内千行百业共同受益。

同时,随着国产大模型持续发展,国内多个大模型正紧追海外的步伐,部分领军者已经基本达到了世界一流的水平。

如今年1月30日发布的讯飞星火认知大模型V3.5,其各项能力逼近GPT-4 Turbo水平,并且已在语言理解、数学能力上超过GPT-4 Turbo。

1月16日,智谱A I推出新一代基座大模型GLM-4,其整体性能相比上一代大幅提升,十余项指标逼近或达到GPT-4水平。

2月2日,商汤发布了“日日新 S enseNova4.0”,多维度全面升级大模型体系,支持128K语境窗口长度,综合整体评测成绩水平比肩GPT-4。

去年10月,百度发布的文心大模型4.0、阿里发布的千亿级参数大模型通义千问2.0,其综合能力“与GPT-4相比毫不逊色”。

能力提升的同时,国产大模型的使用成本也在不断降低。今年5月,字节跳动的大模型豆包喊出比行业便宜99.3%,阿里也宣布通义千问GPT-4级主力模型Qwen-Long价格直降97%。

随后百度智能云宣布,百度文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费。有分析指出,大模型从以分计价到以厘计价将有助企业加速业务创新,更低的成本价格能激发企业的业务场景需求,使得AI模型生态进一步完善,终端客户也将涌现出新的商业应用。

创业的摇滚精神

月之暗面是一家什么样的公司?

我们将这个问题丢给Kimi,它的回答是“月之暗面(Moonshot AI)是一家专注于人工智能技术和大模型研发的高科技公司”,并罗列多条关键信息,包括月之暗面成立于2023年3月,由清华大学交叉信息学院的杨植麟教授领衔,团队成员包括来自Google、Meta、Amazon等国际科技巨头的人才。技术方面,公司在“长文本”领域实现了突破,推出了首个支持输入20万汉字的智能助手产品Kimi Chat。

对于公司创始人杨植麟,K imi回答:杨植麟本科毕业于清华大学计算机系,2015 年进入美国卡内基梅隆大学(CM U)语言技术研究所(LTI),跟随苹果公司A I负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士学位。2019年,他获得了卡内基梅隆大学计算机专业博士学位。

职业经历方面,杨植麟曾就职于Facebook、谷歌等公司,在多个国际顶级AI会议上发表了20余篇论文。同时,他是Transformer-XL与XLNet论文的第一作者,这两篇论文在深度学习领域影响深远。

对于回国创业,杨植麟曾表示,2019年选择回国创业的主要因素有两个:一是看到了国内人工智能发展的巨大潜力,二是希望通过自己的努力推动这一领域的发展。

据介绍,月之暗面联合创始人周昕宇和吴育昕,同样毕业于清华大学,并曾在旷视科技和Met a等知名科技公司工作,参与过Google Gemini、Google Bard、盘古NLP、悟道等项目。

根据月之暗面官微资料,砺思资本创始合伙人曹曦评价杨植麟,是全球大模型领域里最被认可的华人技术专家,其团队在人工智能技术,特别是大语言模型LLM领域拥有深厚的技术积累,并已在国际上获得了广泛认可。

真格基金合伙人戴雨森也表示,杨植麟作为XLNet等多项知名科研工作的第一作者,具备相当丰富的科研和实践经验,多年来他一直坚信通过大模型实现对高维数据的压缩是人工智能发展的必经之路,也团结了一支人才密度超高,配合默契,又充满挑战巨头摇滚精神的创业团队。

事实上,月之暗面这个名字,就是来源于摇滚乐队Pink Floyd的著名专辑The Dark Side of the Moon(月之暗面)。据杨植麟介绍,这个名字象征着神秘与未知,与公司在人工智能领域的探索精神相契合。而月之暗面成立的日期正好是这张专辑发行的50周年。

估值30亿美元

众所周知,自从ChatGPT于2022年11月30日横空出世后,AI就开始引领全球技术革新,并得到各方资金的青睐。

仅2023年,OpenAI融资103亿美元,估值达到270亿至290亿美元;Inflection AI融资13亿美元;Scale AI融资10亿美元,估值138亿美元。

在国内,2023年6月1日,MiniMax完成了超2.5亿美元的融资,公司估值超过12亿美元。2023年3月和4月,西湖心辰接连完成了两笔融资。智谱AI也在去年累计获得了超过25亿元人民币的融资,成为国内估值最高的大模型公司之一。

同样在去年6月,月之暗面也完成第一轮融资,金额超过2亿美元,投资方包括红杉中国、真格基金等,企业估值超过15亿美元。2023年10月,月之暗面再获得红杉资本、今日资本、砺思资本在内的投资机构近20亿元人民币的融资。

今年2月,月之暗面完成10亿美元的第三轮融资,公司估值25亿美元,刷新了国内AI领域最大单笔融资纪录。参与投资的机构包括阿里、小红书等互联网企业,同时老股东红杉中国、砺思资本等继续跟投。

有消息称,5月份,月之暗面又进行了新一轮融资,主投机构为腾讯、高榕创投,月之暗面在此轮融资后估值将达到30亿美元。

在去年国内VC投资“寂静”的背景下,AI大模型是为数不多的投资机构蜂拥抢筹的行业,国内当前估值超过10亿美元的大模型公司有月之暗面、智谱AI、MiniMax和百川智能,阿里、腾讯两大巨头相继参与投资。

据澎湃新闻报道,近期月之暗面正在为进军美国市场做准备,其援引外媒消息,月之暗面的员工最近一直在开发针对美国市场推出的产品,包括在苹果和谷歌移动应用商店上架的人工智能角色扮演聊天应用Ohai,以及音乐视频生成器Noisee的网站。

分析认为,国产大模型出海势在必行,有业内人士称,国产AI出海的原因有二:一是全球市场空间是国内市场的数倍;二是AIGC为创造性产品,海外无论是to B还是to C用户,其付费意愿可能比国内更强。

为此,国内的MiniMax于去年6月上线了主打海外市场的AI虚拟人物聊天软件Talkie;今年5月10日,科大讯飞新加坡办公室开业,正式在海外市场落地;5月23日,阿里云宣布将在全球5个国家投资新建数据中心;5月末,华为也面向北非发布星河AI网络产品及解决方案。

杨植麟也认为,AGI最终是全球化的,未来AI能力的提升会领先于产品的破圈。

声明: (本文为投资有道签约作者原创文章,转载请注明出处及作者,否则视为侵权,本刊将追究法律责任)

读者排行