GPT-4有那么可怕吗?

一封联合信

  3月22号也就是一个月前,马斯克,对你没听错,就是前几天发射火箭失败爆炸的那个,他联合几千名科学家用一封公开信请愿暂停一切大型AI实验半年以上,这六个月的时间是用来做一份监督和规范AI发展的协议,避免AI的发展走向极端,超出人类的控制。

  现在这封公开信已经有超过3万人参与实名请愿。请愿名单里面不仅有图灵奖得主,马斯克,还有各大科技公司总裁和名校教授,这份名单汇聚了当今世界上一流的大脑,而则恐怕也是这个世纪以来这些大脑最团结一致的一次。这封信我非常推荐大家去读一读,就当锻炼英语阅读了。

  第一段直接就告诉我们,当下AI的野蛮生长完全不可控,目前没有人,甚至他们的创造者都无法理解,预测或可靠的控制。在学术的文章里很忌讳用过于绝对的词,但在这封信里,没人敢质疑这群人的权威,反而强调了他们对这件事的理解和态度。

   接下来他们把问题直接抛给读者,问我们是否做好了被自动化所有工作的准备,是否应该发展最终可以超越我们并且取代我们的非人类思维,是否冒险失去对我们文明的控制。这一番问题直接把我们拉入情境,以第一视角去审视。

   接着他们呼吁所有AI实验暂停至少6个月的模型训练,给出了合理的解决方案,并期盼一条健康的AI发展,而不是不可控的灾难。

   不仔细看或者不了解的人可能以为是ChatGPT凭一己之力造成如今的局面,但只要梳理AI三月份的发展,你就会发现事情并没这么简单,这些一流大脑怕的并不是ChatGPT这一单一产品,而是这背后所演化出的一场技术竞赛,竞赛里的公司就像饥饿游戏里面的玩家,没人敢掉队。而他们之间的追逐导致这场人工智能潮远超控制范围,因为这些AI框架都有一个共同点,制作者无法掌控程序内部的变化,也就是程序里经常说的黑盒,要理解这场竞争有多疯狂,就得从上个月也就是三月讲起,而上个与也堪称人类AI史上最紧张的30天。

3月:AI的狂欢

  3月8号,微软以百亿美金收购Open AI后,马不停蹄的发表论文预告了Visual ChatGPT聊天时不光可以用文字,还能图文并用,甚至根据指示生成图片。

  3月9号,微软德国CTO公布了即将到来的GPT-4的信息,从单一语言模型进化到多语态模型。

  3月9号,另一家AI公司GigaGAN突然宣布他们训练了一个10亿参数的模型,效果和速度完全不逊色于Stable Diffusion,DALL这些模型。

  3月13号,斯坦福大学LLaMa公开了一个叫7 Billion的模型,训练了他们自己的一个叫Alpaca的模型,表现极好。

  3月14号,Open AI发表最新GPT-4的论文,多模态和图片输入功能如期而至。

  3月14号,Google也在同一天公布了PaLM模型API的入口,并且提到要把这个模型集成到旗下的Workspace中使用

  3月14号,Anthropic介绍了他们自己的大语言模型Claude,成为目前市场上ChatGPT潜在的最大竞争对手,

  3月14号,另一家大语言公司Adept AI公布了他们刚完成B轮3.5亿美金融资,同时透露了他们的模型会使用工具、软件等等特性。

  3月15号,地表最强AI绘图公司MidJourney迭代出第五代模型,以前AI绘图无法精细化手指的细节经过这次更新不仅解决了多手指和少手指的问题,还直接把手部细节做到了极致,进化速度和精度堪称恐怖。

  3月16号,微软公布了结合GPT-4的Copilot,自称地表最强生产力工具,包含各类自动化书写工作:做表格、做PPT、出项目报告、工作总结等等,已然做到了打工人只用表达,他就能帮忙处理绝大部分任务的程度,可以说是解放了数十亿打工人的双手。

  3月24号,微软再次放出一篇154页的论文,表示向人类一样思考,像人类一样去做事的人工智能AGI已经开始萌芽,在他们的测试里,ChatGPT和Google的PaLM模型都展现出比以前AI模型更普遍的智慧

  3月27号,百度文心一言发布会,也在中国战场开始厮杀。

  3月27号,OpenAI发表了一篇论文,这篇论文测量了ChatGPT对我们生活的渗透程度,还有对将来职业可能造成的影响,这也是大多数人做关心的问题,它会给我们的生活带来怎样的影响。论文里他们收集了1016个不同职业信息,这不是一个做做样子的数据量。分析得出的结果是在美国80%的劳动力市场会因此受到影响,19%的职业会通过ChatGPT能减少超过一半以上的工作量,受影响较高的职业主要和科学还有批判性思维这种技能反向相关,也就是说具备科研能力和科学思维的人还不需要太担心,目前语言模型还不具备这些能力。受波及较大的是写代码和写文章之类的工作。他们列出了使用AI后能大幅提高工作效率的职业:翻译、研究调查、写手、动物科学家、数学家、金融分析、税务员等等,反之人们也很担心自己就这么被取代,OpenAI也列出来了那些目前肯定不会被取代的职业:运动员、木匠、刷漆匠、厨师、房顶安装等等需要人力亲力亲为的事GPT肯定没法触及,不过这些得等机器人和机器臂完全成熟并且商业化了。(别忘了波士顿动力公司)

  疯狂的3月从OpenAI开始也由它结束,AI的渗透率逐渐升高的同时还发展迅速,GPT-4的模型还有自我进化的能力,在之前的论文举例里,微软团队分别对GPT-4模型请求了3张一样的独角兽图片,一开始不堪入目,但仅仅两次迭代就发生了明显的进步,这是团队也不清楚的隐藏技能。GPT-4有那么神吗?

全面了解GPT-4

多模态交互

  首先GPT-4是一个支持多模态交互的模型,也就意味着除了进行文字交互以外,多模态模型还能支持包括图片、音频以及视频等在内的交互方式,充分模拟人与人之间的交互。在发布会上OpenAI首先展示GPT-4强大的“看图说话能力”,开发者在草稿本上描述他需要生成一个网站,只需要将这张图片传输给GPT-4,它在短短几十秒之内就能通过HTML以及CSS语言的编写,直接生成一个能跑的网站。可以想象在继集成了GPT-4的开发套件里,未来前端的界面更改可能仅仅需要产品经理的一个产品文档即可。

 模型的大小

  GPT-4的模型打大小远超ChatGPT。ChatGPT的模型一共有1750亿个参数,而GPT-4之前按专家猜测估计大约会有100万亿个参数,大约是ChatGPT的500倍。很明显GPT-4和ChatGPT的模型体量不在一个数量级。但是有一种叫能力涌现的现象,即当模型的容量大小在达到某个阈值之前人工智能模型几乎无法完成对应的复杂任务,而在超过这个阈值之后模型的能力才会出现非线性质的飞跃。就比如以前ChatGPT就长期被诟病数学能力弱,逻辑推理经常出现谬误等等,随着GPT-4拥有了更加夸张的模型容量,这两个问题都被迎刃而解。

 能力测试

  在美国的研究生入学标准测试(GRE)中,ChatGPT的表现在逻辑推理科目中处于中游,在数学测验中几乎是垫底生。反观GPT-4,它在这两个部分展现了相当头部1%以及头部20%的学生水平,在其他更依赖记忆而非逻辑推演的心理学、历史学、生物学等等的大学预修考试几乎都获得了5分的满分。

 自我意识

  不久前,斯坦福大学计算机心理学教授发布一篇名为“ToM可能自发地出现在大型语言模型中”。简单来说,他在探讨以ChatGPT为首的人工智能理解人类复杂心理的能力,如果再把这个概念进行抽象和延展,根本上心智理论就是衡量AI是否产生自我意识的重要指标之一。介于很多人着急下定论,还不理解背后的技术和标准就已经先入为主的认为AI拥有了自我意识,还有些人过度自信,认为大语言模型无法催生出意识形态,GPT的意识层只是门外汉的自我幻想。这里我想说,你先别急,别误会,也不要着急表达,因为即便是现在行业最顶尖的学者也只能管中窥豹,在现有的理论和数据基础上进行猜测和总结。

  历史上有一个出名的测验叫Smarties Task,通过测试来判断一个人对自己意料之外的事情的判断力。几个月前这篇论文的作者组织了多次这个测验,用不同的语言模型轮番测试,得出了一组数据,从2018年开始的GPT1完全没有这方面的能力到2020年GPT3开始答对40%的ToM测试,再到今年GPT4完全正确回答ToM测试,已然是成年人的标准,这时候论文作者迈克尔就开始出现一种微妙的感觉,他很快联系上这个世界上最懂ChatGPT的男人,OpenAI的首席技术官伊尔亚·苏茨克维,再沟通后,他俩都认为需要引入心理科学来辅助AI神经网络的发展。很巧的是,伊尔亚在这段时间发了一条耐人寻味的推特,他认为如今的神经网络或许存在一些意识。更有意思的是,同一时间OpenAI公司的CEO山姆阿特曼就站在反对派,他认为GPT3或者4不太可能拥有意识,如果有那也是一种陌生的意识形态,至少和我们所理解的意识不同

 

如何应对

  ChatGPT所掀起的浪潮,已经不仅仅涉及个人,还关乎到各国未来在国际的地位。在文章首部提到的那封联合公开信的引用里面,有一篇叫AI-X风险分析的论文,里面罗列了8个AI危险推测和失败模式。在附录里有一些例子,最有意思的是权利争夺,上面写到拥有更多权利的代理人,他们更容易实现他们的目标。所以谁成立AI的领导者,谁就在某种程度上控制了世界。大语言模型所影响的是“知识的创造、继承、应用”这三个环节所构成的学习系统,是任何生命系统得以延续的根本,决定了个体和文明认识世界和改造世界的能力。在整个人类史以及整个生命史中,凡是学习系统的升级,都会伴随着跃升。现在人类正处于下一次跃升的过程中,但还缺少一项升级学习系统的技术,而大语言模型很有可能就是这项技术,因为它正在改变人类“群体应用知识的方式”和“继承知识的方式”,甚至可能在未来形成“人机合作的科研”,改变人类“创造知识的方式”,若真如此,那人类必然会因此步入下一个文明形态。中国错过了三次工业革命,所以这些年我们一直在实现民族的复兴,不能再错过这一次机会。未来的大语言模型能够让每个人都更快的获取“承载知识的符号”,会降低继承性人才的竞争力,每一次的技术革新势必会引起很大的行业变革,我们要做的不是去恐慌,而是抓住这次机会,这次各行各业都将经历一次大洗牌,所以每个人的学习能力和理解能力将成为驾驭这项技术的关键,如果个体学习能力没有相应地提升,就无法发挥这项技术的优势,所以我们每个人都要加强对学习能力和高层次认知能力的训练,愿大家都能借此东风实现自己的目标。

 
参考:
B站up主老阳的奇妙电波
B站up主硅谷观察室
B站up主YJango

热门相关:超武穿梭   薄先生,情不由己   寂静王冠   学霸女神超给力   横行霸道