从ChatGPT 热看中美人工智能竞争
五天超过百万用户,两个月获得上亿用户。ChatGPT的火爆肉眼可见,这家企业的创始团队包括马斯克和彼得·蒂尔等知名大佬,后又背靠微软,从微软获得了数据(比如微软小冰采集的对话数据、GitHub的开源代码库)、算力(微软Azure是全球前三的云服务供应商)、资本(微软数轮入资,今年还将投资几十亿美元)等方面的支持,可以说整个硅谷的资源都被调动起来,聚焦到ChatGPT身上。
ChatGPT的优势在于,它真的有用。之前很多人将人工智能叫做“人工智障”,因为其他人工智能往往答非所问,或者你要按照人工智能习惯的方式来提问才能得到正确答案,而ChatGPT具备上下文语义理解能力和逻辑能力。如果你问的问题它不懂,它就会向你反问,要你补充问题的信息,最终通过一问一答找到你真正需要的答案。
在文本创作、知识数据搜索和代码书写等方面,ChatGPT都有优于谷歌等搜索引擎的用户体验,这让在AI领域深耕多年的谷歌艳羡不已,也让其他一众聊天机器人黯然失色。而一旦用户数量达到一定规模,通过用户的提问,在线数据将支持ChatGPT的数据训练集进一步丰富。可以说ChatGPT让AI达到了一个奇点,而这个奇点之后有可能是一轮AI领域的“宇宙大爆炸”。
国内也有很多聊天机器人,但与ChatGPT相比,还有很大差距,大多数国内的AI应用是一问一答,且有的时候还会误解用户的意思,让人啼笑皆非。国内的AI应用为什么会和美国的ChatGPT拉开差距呢?原因是多方面的:
其一,从技术资本层面,最大的限制来自算力、算法、数据。
算力方面,我国的数据中心多面向软件应用环境,比如游戏服务器外包,真正面向AI的算力非常少。而算力本身是非常昂贵的,模型越大,数据越多,数据训练AI所要消耗的费用就越多,一次集中算力训练需要几百万美元的算力,这是国内AI公司不能负担的。
数据方面,国内数据的质量普遍不高,一方面是因为数据本身积累上的问题,比如小冰用免费AI对话来积累数据,比如GitHub这样的代码开源网站比较缺乏。另一方面是因为数据管理较为严格,部分数据文本需要审批才可以被人工智能企业使用,减慢了数据价值的释放。
算法方面,我国AI 开发者有思维惯性,过度依赖开源内容,对大模型缺乏探索创新。当然,算力、算法、数据的问题有些也是资本问题,没钱导致没办法进行大模型、大数据量的训练,但有些也是管理需要改进的地方。
从管理层面来看,数据要素流通需要进一步打通,除此之外,我国对AIGC的内容创作也要采取开放包容的态度。AIGC作为技术黑箱,其产出的内容往往是不可知的,在输出内容方面要允许AIGC犯错误,让AI企业敢于在技术上突破。
综上,一方面要堆钱,算力、算法、数据都要钱。另一方面要松绑,宽松的环境能够让技术的生长速度更快。但短期内比较迫切要做的事情是,如果ChatGPT 开源,当然皆大欢喜,国产势必跟上;如果ChatGPT不开源,我们是否应该引进ChatGPT。引进ChatGPT的理由有两个:一个是看ChatGPT是否在国内存在合规障碍,如果ChatGPT可行,国内企业就可以模仿;另一个是ChatG-PT对代码写作和内容创作来说是一种生产力工具,能够提高内容产量。
当然,实事求是地说,中国人工智能近些年的进步是巨大的。当前,全球人工智能发展呈现出中美两国引领、主要国家激烈竞争的总体格局。中国人工智能发展成效显着,人工智能创新水平已经进入世界第一梯队,与美国的差距进一步缩小。但中国在人工智能人才方面仍落后于美国,中国在人工智能基础学科建设方面不及美国。
而ChatGPT热潮席卷全球的背后,也带给我们深刻的思考,人工智能作为未来产业、经济社会发展中的一项变革性技术与关键性力量,深刻影响着未来世界的竞争格局。于中国而言,在人工智能发展领域并非到了“刀枪入库,马放南山”的阶段,反而恰恰如中国的一句俗话所说:“逆水行舟,不进则退。”所以,我们在人工智能技术及产业发展上依然任重而道远,须臾松懈不得。
(作者:盘和林,系浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员,工信部信息通信经济专家委员会委员)
(编辑:王小莉)