吕归亚:AI大模型之争远未落幕
自2022年年底OpenAI发布聊天机器人ChatGPT3.0后,各大科技公司纷纷跟进推出各自的产品。经历了一年多高速推进且“万众瞩目”的发展后, ChatGPT依旧是行业内的标杆级存在。而3月初Anthropic发布的Claude 3,被很多人认为是ChatGPT的一个有力挑战者。
相比财大气粗的科技巨头谷歌和微软,Anthropic仅是个百余人的小公司,却有着不可忽视的“血统”。Anthropic由退出OpenAI的资深员工于2021年创立,其核心成员有参与ChatGPT2.0及ChatGPT3.0的研发经验。Claude 3 Opus(Claude 3三个版本中性能最优秀的旗舰版本)在多项人工智能(AI)基准测试中,展现出了优于ChatGPT4.0的表现,并在编码等广泛认知领域证明了自己的能力。
尽管Claude 3 Opus的基准测试结果令人瞩目,但它依旧有不足之处。与人工智能领域的一些竞争对手不同,Claude 3无法访问网络,因此向它询问 2023 年 8 月之后的事件不能得到有用的信息。目前Claude 3 Opus能做的事情依旧十分有限,仅是一个聊天机器人,能回答2023 年 8 月之前发生的大部分事情,并能高效分析文本文件,尤其是长篇且晦涩的文件,但在逻辑推理方面仍有欠缺。
如Claude 3和ChatGPT4.0这样基于大语言模型的聊天机器人已经初具通用生产力工具的雏形,熟练使用这类工具可以大幅提高工作效率,但距离完全取代人类工作尚有不小的距离。因为运算能力的差距,在许多给定条件的任务中,AI的表现已经超过人类,比如阅读和总结数十页的尖端科技论文或者下围棋,但可能在逻辑推理问题中输给人类。目前来看,现存的人工智能依旧没有超脱工具范畴,大部分情况下需要由人类使用和驱动才能完成工作。如同汽车和飞机让人们加快了移动速度,目前的人工智能可以帮助人们更好更快地归纳和总结大量信息,相比于担忧工作被人工智能取代,目前更应注重掌握人工智能工具以提高工作效率。淘汰马车夫的不是汽车,而是汽车司机。
在人工智能发展方面,Claude 3的出现反映出人工智能大模型之争远未结束,OpenAI尚未做到独步天下,世界范围内的各家公司依旧有着赶超空间。Anthropic的成功告诉我们,有经验有技术的开发者,在有充足资金的支持下,是有能力快速追上乃至于赶超OpenAI的。目前来看,人工智能大模型成功必须具备的三要素是:人才、资金,以及团队的共识。GPT-4、Sora、Gemini、Claude 3等,这些在基础大模型领域领跑的产品,从数据到模型,无一不需要大量经费与顶尖人才。与此同时,大模型的研发团队也需要就人工智能发展的方向达成共识。最尖端科技领域的研发人员,在发展方向上达不成共识也会影响大模型的产出。如此前的OpenAI董事会成员相互指责违背初衷这样的“内斗”,可能会极大延缓研发进度。
另一方面,人工智能大模型的商业价值也仰赖于应用的开发。Claude 3没有集成第三方应用程序和服务,这限制了其实际功能。谷歌的人工智能大模型 Gemini Ultra 可以访问用户的 Gmail电子邮箱来汇总邮件,ChatGPT 可以通过 Kayak 插件获取航班价格,Claude 3却做不了这些事,Anthropic在这方面还有很长的路要走。
美国大模型竞争也给国内人工智能企业带来了一些启示。首先要在基座大模型上进行精兵布局,打造几支高质量的团队,这些团队汇聚共识,挖掘顶尖人才,以国际为赛场。其他企业应着眼布局垂类大模型和场景大模型的开发,基于国内丰富的行业经验及平台经济经验,重点发力。与此同时,与基座大模型形成互动,助力基座大模型弯道超车。垂类大模型和场景基座应充分关注应用开发,以便发挥基座大模型的经济价值。只有做到“两条腿走路”,才能在人工智能发展上取得先机。(作者是奇安信集团职员)