查看原文
其他

月之暗面的暗面,AI大模型的中场战事

马男MANAN 饭後服用AfterHours
2024-09-10


到底是不是只有喜欢摇滚乐才能做好产品

文|马男MANAN 🐴一个不懂运营的产品经理

这是 饭後服用AfterHours 的第 142 篇原创文章,感谢大家一直以来的支持

正文

Money:Money Money

张小龙在微信上线后半年的2011年9月14日在饭否写到,“面试产品经理,所有技能合格后,要问,你喜欢摇滚吗?回答否的,就算了。”

而月之暗面的创始人杨植麟好像对于摇滚乐也有不少执念

在清华读大学期间,杨植麟创立了摇滚乐队Splay,并担任鼓手——乐队名取自数据结构Spkay Tree。众所周知鼓手(键盘、贝斯或者唢呐,总之不是主唱)是乐队的灵魂

不过他没把这份执念放在面试部分,而是直接刻在了自己公司的额头上。相比上一代“产品之神”的内敛与克制,新一代的AI大模型创业者显得更为高调

2023年是《月之暗面》专辑发布50周年。相比于20世纪70年代的中国,这张专辑更符合当下的时代精神和社会基调。在大工业时代狂奔40年带来的物质消费富足之后,这个社会在精神层面变得更加混乱,神经质,不可预知

因为这张42分53秒的专辑探索了冲突、贪婪、时间流逝和精神疾病的主题,其中精神疾病这个主题的灵感来源于精神状况不断恶化的乐队创始人西德·巴雷特。赋予了这张专辑一种无法言喻的力量和深度

专辑中大量的合成器的使用,也给专辑涂上了一层原子时代科幻太空的神秘感。但是背景里无处不在的清脆鼓声,这种声音又好像只能来自于地球,也许是希望在进入太空遨游碰撞的开始阶段,能够保留一些清醒

月之暗面无疑是当下的明星公司,其在5月最新A+轮的估值报价或达30亿美金,此轮融资新入局的投资者包括腾讯、高榕创投等

在这之前,其分别在2023年的6月和2024年的2月进行了天使轮和A轮融资,估值分别达到3亿和25亿美元。其投资者包括红杉、真格,Monolith砺思资本,美团,小红书,阿里等

抛去大厂在其中必须要参与的因素外,在这些投资里我们一直很难忽视一个身影

张予彤

其履历不太需要过多介绍,总之其与本文相关的关键标签有三个

1.号称朱啸虎接班人的:金沙江创投成立以来的“史上第二位”依循业绩机制晋升至主管合伙人职级的投资人

2.毛文超的学姐:其在小红书初期一众项目中慧眼识珠,并且深度参与了项目决策及其团队早期的业务方向及建设

3.杨植麟的早期项目投资人:“循环智能”是杨在博士期间的首次创业,也拿到了红杉的投资,当然张也是杨的清华学姐

人生发财靠康(学)波(姐) 啊

开玩笑,当然成功还是要靠自己努力。总之这里面有两家公司在张学姐这产生了交集

23年底的时候,雷峰网曾经报道过河童因为小红书社区增长乏力而离职的事情,当然今年4月也找到了其接任者

不过我们分析一下这件事情,一个刚胜任VP一年且“制定了社区标准和价值观”的所谓带来增长的“功臣”,在目标未完成的状态下选择离开。这个决定实在是有点诡异

一般来讲这个级别的调整,大多是因为职场理念和方向的冲突。以及如果真是这种情况,公司的决策一般会考虑先边缘化,再慢慢退休,直接离职并不多见

以及这种级别和成绩的人,市场一般都是抢着要的,但从去年年底到现在,市场上并未传出任何河童再任职,甚至于其他公司接触的消息

当然据一些消息称,张作为这两家公司的投资人,是想运作河童去月之暗面的

站在投资的视角上,小红书固然是当前传统互联网最后的荣光(之一),可AI明显才是更有想象力的那个

当下AI公司也有很大增长压力。找自己熟悉的、有过增长成功经验的老伙计是再合理不过的一件事情

但就算AI是当下最具想象力的事情,投资人下场自己操刀也出乎所有人的意料。其固然有一些下场的经验,但投资和做项目究其根本还是两码事

况且张一直以来传言是朱的接班人,在这个时间点,放弃一个确定性极高收益极高的事情,去转作确定性未知且收益同样未知的事情,怎么看都不像是这种阅历的人能做出的理性选择

市场上有一些传言是张在做月之暗面fa的时候,存在一些资金往来。所以朱才会那么的生气

Brain Damage:增长的压力和管理的混乱

大模型的增长是当前所有公司头疼的问题,不管是To B还是To C的用户

而前些年的疯狂补贴和游戏化带来的传统互联网增长遇到瓶颈、停滞不前以后。如今大模型仿佛又开始了通过降价补贴来抢市场的新一轮战争

字节跳动在5月15日的豆包发布会上,高调宣布了0.1折的行业价格。之后各友商顺势开卷,大模型在瞬间突然无限逼近了免费时代

- 字节豆包通用模型Pro-32k 0.0008元/千Tokens

- 阿里 通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens

- 百度文心两款主力模型 免费

- 科大讯飞星火Lite API 免费

- 腾讯混元大模型lite 256k 0.008元/千tokens调整为全面免费

- 智谱AI 个人版/入门版GLM-3 Turbo模型 0.001元/千tokens

- DeepSeek 第二代MoE模型DeepSeek-V2,每百万token输入1元、输出2元(32K上下文)的低价

当然,这是有利于行业整体发展的,但是大模型仍旧是个烧钱的生意。有报道称月之暗面拿了阿里的投资,其中80%是用作阿里云的成本

当下的大模型公司,整体被算法能力的迭代推着走,算法决定了公司的生与死。而更别提大量资本进入后,对AI带来的未来期望变的更加饥渴

市场的逻辑是,有更好用的模型能力,就能直接或者间接覆盖更多的C端用户,所以大模型公司在竞争下被迫开卷。一切以市场的增长为目标

但这同时也带来了一些管理的问题

公司负责增长、运营和安全的团队就会在这种情况下被迫背锅。因为市场当下的唯一目标就是要增长,但是但是模型输出安全跟不上。这期间就会产生在竞争下增长目标定的很高,但是团队做不完,以及极大的不确定性的安全风险导致产品下架的问题

我们总是关注到类似字节,小红书这些成熟公司的高管团队变动。但其实在这些AI大模型公司里,和增长及安全相关的岗位,也会频繁的被迫变动

这就有点以增长为一切目标,先污染后治理的意思了。这就导致根本没时间去解决公司治理和组织架构的问题

目标明确在当前的大模型公司,已经是相对不错的状态。更别提团队有时候最初就引入了派系

在大模型公司的核心团队里,只有很近的嫡系才能稳住当前的位置,发现情况不对联创跳坑的事情也很常见。这里面的理由也是千奇百怪,不是自称要申请院士不方便持股,就是决定出国继续深造。当然其实很多都是自己出去又拉了投资,重新再做一个模型公司

还记得前一段时间炒的沸沸扬扬的杨植麟套现风波,其实从3月份就已经出现创始人套现的风声,直到一个多月后才有媒体开始在报导相关事件

相比我们听的够多的明星公司来说,上文中的deepseek反而是一家低调的好公司

Any Colour You Like:被逼的宣传战

2024年3月18日,月之暗面科技有限公司宣布了一项重大突破:其开发的Kimi大模型产品成为国内首个支持高达200万字上下文的人工智能助手

这一消息确实如重磅炸弹,不仅是在科技界,在很多使用者中间也产生了不少的关注。Kimi的爆火出圈,让其在社媒上实实在在的吃透了一次流量。而且使得Kimi的用户活跃度瞬间飙升至600万,这一数字的增长速度和规模在业界都前所未有

这种爆炸的增长,给其他大模型公司带来了不少的压力和挑战。因为上文有提到,增长现在才是大模型公司的第一目标

所以很多大模型公司开始跟进,希望复制这一成功模式。这些公司其实是有自己阶段性的技术积累和模型研发成果的。但之前一直未曾对外公开。现在希望能够借助这一波宣传,能带来的增长,吸引更多的用户和关注

一些技术出身的,AI大模型公司的CEO们也开始转变自己的角色。他们原本不擅长面对镜头,更习惯于在幕后进行技术研发和产品创新。然而,为了配合公司的市场战略和公关需求,这些CEO们开始走出自己的办公室,接受媒体采访,参与各种公共活动。他们开始尝试和公众沟通,向外界展示自己公司的技术实力和产品优势

去年大家还在比谁的显卡多,今年就在比谁的声音大了

但是如果科技战,变成了宣传战就一定有问题,各方都想吃大模型的蛋糕,自然就有“欺不如窃,窃不如偷”的事情发生,唯一的区别就是是否有人知道你是偷的

斯坦福AI团队被曝抄袭中国大模型

5月29日,斯坦福大学的学生团队公布了一篇题为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的研究论文,宣布他们成功开发了一个开源的多模态AI模型Llama 3-V。该模型在性能上超越了GPT-4、Gemini Ultra、Claude Opus等知名模型,并且其训练成本仅为500美元

斯坦福团队的成员Aksh Garg通过社交网络X分享了这一成果,其帖子迅速获得了超过30万的阅读量,Llama 3-V模型也迅速登上了全球知名的开源社区HuggingFace的热门趋势榜首

不久后,一些热心网友注意到,Llama 3-V模型与清华大学背景的初创公司面壁智能开发的MiniCPM-Llama3-V 2.5在结构、代码和配置文件上存在高度相似之处,唯一的区别在于变量名称的变更。这位网友还提供了截图和证据,详细列举了两者之间的相似点

6月2日深夜,面壁智能的团队确认,Llama3-V模型与MiniCPM一样,能够识别“清华简”中的战国时期古文字,并且错误之处也完全一致。这些古文字数据是面壁智能团队经过数月的努力,从清华简中逐字扫描并人工标注得到的,此前并未对外公开,这进一步证实了抄袭行为的存在

面壁智能的CEO李大海在社交网络中表达了他的遗憾:“技术创新是一条艰难的道路,每一项成果都是团队不懈努力的结晶。”他还表示:“我们希望团队的杰出工作能够得到更多人的关注和认可,但不希望是通过这种方式。”

而国内某大模型声称的万亿模型,且实际上也是基于MoE 魔改的八千亿模型,在市场认知里,其宣传分量远远大于其技术分量

在《比利林恩的中场战事》中有一句经典台词是,“被人们尊称为英雄,这对一个年轻人来说未免太沉重了”

这对当下大模型公司来说也是如此,当通过自己的宣传和市场的声浪,被定义为这一行业的英雄时,也需要考虑自己是否能够承担起这份英雄称谓的重量

在成为英雄之后,是否真刀真枪的战场,才是这场大模型战争每天的真实生活

毕竟《The Dark Side of the Moon》这张专辑最后一首歌《Eclipse》中的最后一句歌词这样写到:

There is no dark side in the moon, really

Matter of fact, it's all dark

月之暗面存在于虚无,事实上所见之处皆是黑暗

END

- 封面及插图来自网络,如有侵权,请联系删除

- 小标题来自于《The Dark Side of the Moon》中歌曲名称


坚持对互联网行业事件的独立思考和原创文章

提供专业视角、有门槛的高质量交流

不随波逐流,不生产垃圾,不哗众取宠,不发自拍

👍 🌟 🌝


▼一些其他值得看的▼


饭后聊聊|小红书终于向快手看齐了

·

饭后观察|比职场博主赛道更拥挤的是“前百万年薪”们



在这里还是想麻烦大家,如果喜欢我的内容,还请继续帮忙⬇️分享、点赞、在看、关注星标

个人观点,仅供参考
继续滑动看下一个
饭後服用AfterHours
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存