目前全球最火的人工智能产品,莫过于OpenAI公司推出的聊天机器人ChatGPT,凭借其连续对话能力、强大的理解力、回答的准确度和创造性使其迅速蹿红。它之所以有着超乎寻常的理解和答案反馈能力,主要是采取了人工智能技术中的深度学习算法和神经网络来构建其大语言模型,通过不断地投喂数据训练及人工标注并升级迭代后,才有了近期这般惊艳世人的能力。大模型的未来可谓充满想象力,它不仅能增强 AI 技术的通用性,还能扩展应用场景、人人易上手,都可以使用,利于形成了一个开放的生态,激发大众创新。
目前在人工智能大语言模型赛道中,ChatGPT可谓一骑绝尘。谷歌公司匆匆推出的Bard首秀不佳,造成股票大跌。微软则宣布全线旗下产品全线接入 ChatGPT,公司股票市值一夜狂飙800亿美元。对比国外风起云涌地AI大战,我们国内已经落后一节。好消息是,国内众多大平台公司以及看好大语言模型AI前景的科技人士,已经加入到了研发对标ChatGPT的大语言模型赛道中。
不算新投入这场人工智能竞赛的潜力选手,今天我们就先盘点一下已经在研有不短时间,已经能提供初步产品的五大国内竞品:百度的“文心一言”、腾讯的“混元大模型”、阿里的“通义大模型”、华为的“盘古大模型”、复旦大学的“MOSS”。
第一个,就是国内的搜索引擎龙头企业百度公司。作为在AI领域深耕多年,对大语言模型投入了众多资源持续研发,百度公司拥有多年的训练数据和参数积累,厚积薄发,所以它才能紧跟OpenAI公司步伐,在最新版GPT-4公开两天后,于3月16日在国内推出首个大语言模型产品“文心一言”。它属于百度公司自研的新一代知识增强大语言模型。其训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。已经可以在文学创作、商业文案创作、数理推算、中文理解和多模态生成五大场景中使用。
据部分试用过的网友反馈,虽然对比ChatGPT上一版本的GPT3.5还有明显差距,但也算达到了及格和能够使用的标准。相信通过投喂更多高质量数据进行自主学习以及人工标注优化后,它也会同GPT般不断迭代、升级,能跨过从能用到好用的阶段。
第二个是腾讯公司自研的预训练AI——混元大模型。它也是使用万亿参数,是一个覆盖了 NLP(中文语言)、CV(视觉)、多模态的基础大模型。它采用腾讯太极机器学习平台自研的训练框架 AngelPTM,其特点是单机可容纳的模型节点多,可容纳万亿规模模型,节省训练资源,且提升训练速度。部分成果已经运用到广告投放及微信搜一搜功能中。
在ChatGPT爆火后,腾讯公司安排首席科学家张正友博士领衔一个项目组进行开发,目标是打造一个类似ChatGPT的对话式产品,即腾讯智能大助手。目前测试时间尚无时间表。
第三是阿里集团研发的自然语言处理和多模态理解与生成AI——通义大模型。2023年4月7日的阿里云峰会上,阿里巴巴集团董事会主席兼CEO张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造升级,并面向企业和少数用户启动邀请测试。这个“通义千问”就是在通义模型基础上打造的,类 ChatGPT 的对话机器人产品形态,它也具备回答问题、创作文字,表达观点、撰写代码几大功能。
目前“通义千问”将问答内容暂时限制在效率、生活、娱乐三大类。据测试人员反馈,它的运算能力还比较差,会算错数学的加减乘除,有时还会瞎编乱造,但已经是国内最接近ChatGPT水平的本土化大语言模型。其在中文写作和代码编写方面领先于文心一言,相比GPT-4在文字方面仍有明显差距,且不具备多模态能力。相信经过内测逐步完善后,再面向公众开放测试。
第四是华为公司研究多年的超大预训练系列模型——盘古。它包含五个基础大模型:中文语言大模型、视觉大模型、多模态大模型、科学计算大模型、图网络大模型。与GPT相似的产品就是其中的中文语言大模型。它是业界首个超千亿参数的中文预训练大模型,与ChatGPT等外国AI模型相比,华为盘古中文大模型更注重针对中文的优化。在2021年度中文语言理解评测基准CLUE榜单中,盘古中文大模型在总排行榜、分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录,多项子任务得分业界领先。
可在4月8日的人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇介绍了盘古大模型的进展,他重点介绍了盘古模型在具体行业和机器视觉方面的应用范例,但对网友们最关注的中文大语言模型进展,并没有过多涉及。但在华为云官网上,其中文语言大模型已标注为即将上线状态,大家都在猜测华为是在憋大招,或是打算将大语言模型训练得更成熟后,再向外界公布,我们只需耐心等待一段时间即可知分晓。
第五是复旦大学计算机科学技术学院团队,准备开源的对话式大型语言模型MOSS。 MOSS基于公开的中英文数据训练,目前已经拥有200亿参数,具有和人类对话的能力,并可以通过与人类交互实现迭代优化。可受限于训练上投入的资金有限,MOSS相较于千亿级的ChatGPT,大概只是其规模的十分之一,造成目前MOSS的整体完成度却并不高。复旦团队已经计划在4月中旬开源,将研究成果与业界和社区分享,降低预训练语言模型的研发和应用门槛,帮助中小企业在其基础上更容易开发智能客服、智能家居等各种垂直类产品。
国内其他科技企业,如字节跳动、科大讯飞、美团、京东和360公司等,也都抓紧在大语言模型方面布局和重点研究,希望能在这一轮人工智能竞赛中抢得先机。
总的来说,国内的上述与ChatGPT相似的竞品,与最高水平的GPT-4.0差距明显。但最困难的阶段已经跨过,路途与目标已经帮我们探明。ChatGPT证明了超大参数模型的可行性和惊人效果,确认了“大力出奇迹”。其他公司只要沿着这个方向做复现和优化,只需要再多一点耐心和时间,相信我们国内也能研发出达到GPT-4水平的高质量对话式大语言模型。
前路漫漫,但未来可期,加油吧!中国AI!
,Copyright © 2008-2022 秒下下载站
m.down10s.com .All Rights Reserved