智见|专访智谱AICEO张鹏:国产ChatGPT的春天来了吗?
出品|科技《智见访谈》采访|丁广胜撰文|袁宁风暴自ChatGPT 震撼亮相起。国外,一路狂飙,其背后的GPT大模型全方位秀肌肉,不断展现其惊人能力。又迅速演化,完成迭代,仅四个月后就发布GPT4,引发连连惊叹。国内,百花齐放,你方唱罢我登台。百度、阿里等互联网大厂纷纷亮相对标产品,试与ChatGPT比高。然而与此同时,对于国产对标产品的质疑声也愈发响亮。新一轮技术革命已然来袭,我们距离ChatGPT有多远?科技与北京智谱华章科技有限公司(下称“智谱AI”) CEO张鹏进行了对谈。谈差距:国内大模型与ChatGPT之间的差距并不大智谱AI在大模型领域深耕多年,其研究出的GLM-130B是国内唯一一个入选斯坦福大学基础模型研究中心,能跟顶尖模型一较高下的基座模型。自2022年8月发布以来,已收到41个国家266个研究机构的使用需求。谈到国内外的差距,张鹏认为,国内大模型与ChatGPT之间的差距并不是很大。他表示,虽然国外在人工智能领域的布局可能更早,但国内很多大厂和研究机构也一直保持着很高的关注度。大模型技术具有高投入、高要求的特点,团队、算法等方面也是一个系统性的工程,因此大家对此的投入都比较谨慎。中国起步的速度可能会比国外晚一些,但并不代表国内没有做这些事情。为了吸引更多人了解和参与到大模型的开发和使用中来,共同推进技术的发展和创新。今年3月,智谱AI开源了“中英双语对话模型ChatGLM-6B”,支持在单张消费级显卡上进行推理使用。这是继此前开源GLM-130B千亿基座模型之后,智谱再次推出大模型方向的研究成果。谈落地:基座的能力上限非常关键张鹏介绍,目前在生成式AI领域,主要可以分为三类角色。第一类是关注于底层模型和基础能力的建设,目标是以通用模型为目标,提高模型的通用能力、方法能力、多任务能力和跨模态能力等。第二类是基于基础模型的泛化能力去做上层应用开发,结合场景和行业的深入知识和积累,去快速地帮助行业用户解决实际问题。第三类是作为辅助性技术的供应商,帮助解决工具提效等方面的辅助性问题。智谱作为专注于底层模型的一类,张鹏强调,基座的能力上限是非常关键的。ChatGPT正是摸索出了一套方法来更好地发挥能力上限,而落地的动作也能对技术本身的能力进行验证,在不同场景下实现与用户的触达,获得用户的反馈,帮助对大模型的进一步优化。张鹏很早便提出了Model as a Service的理念,主张提供从预训练大模型到API到应用多层级以及从云端到私有化到一体机部署的灵活部署方式。他认为这种模型与服务的融合可以为传统软件工具驱动的IT系统注入智能驱动的能力,从而重塑整个IT系统的架构。这种重塑将使得IT系统更高效、更智能,进而降低开发成本,提升用户和应用者的收益。因此,Model as a Service的价值远远超过过去每一层形成的时候所带来的价值。谈风险:马斯克们并不算极端3月末,包括特斯拉CEO埃隆·马斯克等在内的数千名AI领域企业家、学者、高管发出了一封题为《暂停大型人工智能研究》的公开信他们在信中强烈呼吁:所有AI研究室立刻暂停训练比GPT-4更加强大的AI系统,为期至少6个月。人们对于人工智能发展的恐慌尽显。对此,张鹏认为,马斯克等并不算极端,他们只是提出了暂停六个月来降低风险的建议,并没有真正要求封禁人工智能技术。相对以往对于克隆技术、基因编辑等的骂声,还相对温和,有助于防止技术发展过快而导致失控的风险。对于中国来说,我们目前可能还没有太多的发言权,但是我们一直在技术发展过程中进行跟进,这件事情也是给我们敲响了警钟,在重视人工智能的发展和应用的同时,也不能忽视了其可能带来的影响。安全性和伦理问题是自AI技术诞生以来,学界、社会和产业界共同关注的问题。然而,在技术发展的同时,解决这些问题还需要考虑到各个方面和群体的利益。技术发展的同时必然会产生新的问题,然而技术本身是可控的。世界不断进步,我们也不需要太过担心。
本信息由网络用户发布,本站只提供信息展示,内容详情请与官方联系确认。