人工智能作为新一代产业变革的核心驱动力之一,其发展已经从“大炼模型”逐步迈向“炼大模型”的阶段。通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,从而服务更多的企业,正在成为人工智能发展的新趋势。
机器人“小科”亮相国家“十三五”科技创新成就展、“冬奥手语播报数字人”在北京电视台上岗。
尽管公众对大模型的概念和它背后的技术突破还一知半解,却已对悟道2.0大规模智能模型驱动下的这些应用不再陌生。
2021年,北京智源人工智能研究院(以下简称智源研究院)发布悟道大模型,连创“中国首个”“世界最大”纪录。
以此为标志,越来越多的研究机构、企业加入到“炼大模型”和推动智能普惠的队伍中,在世界人工智能技术发展和应用中贡献中国智慧和力量。
“开闸放电”普惠社会
2021年6月1日,由智源研究院、清华大学等多个单位联合打造的悟道2.0发布。其参数规模达1.75万亿,打破了之前由国外预训练模型创造的1.6万亿的参数纪录,成为中国首个、全球最大的万亿级预训练模型。
智源研究院学术副院长、清华大学教授唐杰介绍,完全基于国产超算GPU平台打造的悟道2.0取得了多项世界级的创新突破,在预训练模型架构、微调算法、高效预训练框架方面实现了原始理论创新,在世界公认的人工智能能力排名榜单上,取得9项能力的领先地位。
为提升大规模预训练模型的产业普适性和易用性,悟道团队搭建的高效预训练框架,实现了全链路的原创突破或迭代优化,预训练效率大幅提升。
“需求多样化与场景碎片化是AI落地普遍存在的难点。悟道开放平台在快捷易用的同时,更注重解决规模化、产业化AI应用问题。”唐杰表示,悟道大模型具备“低门槛+高效率+高情商”的特点,能够满足不同行业和企业实现规模化、产业化的应用需求。任何企业、开发者拿到完全开源的悟道2.0预训练框架后,都可以快速部署并应用于实际业务中。
OPPO旗下开放式对话虚拟语音助手小布,基于悟道大模型开启的“生成式回答系统”,一举解决了行业共通性的长尾问题,单条回答建设成本降低99%。
高效的机器翻译、智能的对话客服和语音播报在电商、媒体、教育、智能硬件等领域已经表现出极大的发展空间,验证了大模型铺就的迈向通用人工智能的路径极富潜力。
智源研究院理事长张宏江指出:“未来,大模型会形成类似电网的智能基础平台,像发电厂一样为全社会源源不断供应‘智力源’,高效普惠各行各业。”
悟道2.0超大规模智能模型训练技术体系,为我国人工智能应用构建的基础设施,已开始为传统行业智能化改造和升级“开闸放电”。
打造新型研发机制
悟道大模型实现了我国在超大规模智能模型技术的自主可控及前沿引领。智源研究院院长黄铁军从三个角度对于研发机制给予了解释。
一方面,是新时代“集中力量办大事”的科研组织模式,即保持对重大科学问题的敏锐眼光,以需求导向和问题导向布局重大科研任务,建立大任务快速论证启动机制,组建跨机构、大协同、高强度的科研团队,解决大问题。另一方面,以人才为中心,鼓励自由探索,坚持求真务实、不论资排辈的人才发展模式,坚持以“代表作”和“小同行评价”遴选人才,让想干事、能干事的青年人才“挑大梁当主角”。
“智源研究院立志要做‘永远年轻的研究院’,注重对青年学者的吸引,期待与青年学者共同创造科研新范式。”张宏江说,“智源推崇‘代表作文化’,不问出身,不看论文数,只看是否取得标杆性成就,有没有成为标杆的潜力。”
唐杰表示,未来智源研究院将继续推进机制创新,既要“顶天”,也要“立地”。在吸引更多学者加入,创造出更多类似悟道大模型的科研“代表作”,推动北京率先成为国际领先的人工智能创新中心的同时,打造生态,连接技术与产业,推动人工智能产业发展和深度应用。
产学研相继入场
站在“新三年计划”的起点,悟道将围绕提智能、降门槛、建生态多个角度,进一步向“更好用”迈进。
随着越来越多的研究机构和技术公司入场,以虚拟数字人为典型代表的,基于大模型应用的技术创新和产业成果在我国全面开花。
2021年7月9日,中国科学院自动化研究所发布跨模态通用人工智能平台“紫东太初”,基于这个全栈国产化平台,以多模态大模型为核心打造的虚拟人“小初”,图片、文字、语音都能理解,真实呈现了图片、文字、语音三种模态的关联与协同能力,再次缩短了人工智能与人类想象力的距离。
2021年9月28日,浪潮人工智能研究院发布人工智能巨量模型——源1.0,它发布时,已几乎读完了近5年的中文互联网浩瀚内容。
浪潮信息副总裁刘军表示,巨量化的一个核心特征就是模型参数多、训练数据量大。源1.0参数量高达2457亿,训练数据集规模达到5000GB。
如中国工程院院士王恩东所言,让机器像人类一样具有逻辑、意识和推理等认知能力,一直是计算机科学探索、研究的重要方向。在较好解决“感知智能”问题后,这轮人工智能的发展,已经进入通过各种创新解决更复杂的“认知智能”问题的发展阶段。
黄铁军说:“人工智能是新一代产业变革的核心驱动力,它的发展已经从‘大炼模型’逐步迈向‘炼大模型’。通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,供大量企业使用,是必然趋势。”
刘 艳 付丽丽
责任编辑:Rex_02