全球最大规模智算中心启动 智算为人工智能夯实“算力底座”

发布时间: 2022-9-20

  近年来,自动驾驶、生命医学、智能制造等领域发展迅速,随之而来的是超大规模人工智能(AI)模型和海量数据对算力需求的不断提高,智算中心建设正当其时。

  智算,简单来说就是专门服务于人工智能的数据计算中心,是目前主流的算力中心之一,能够为人工智能计算提供所需的专用算力,为计算基础设施带来新的建设方式。

  近日,阿里云宣布正式启动张北超级智算中心,总建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力,超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心,可为AI大模型训练、自动驾驶、空间地理等人工智能探索应用提供智能算力服务。

  随着张北超级智算中心的启用,阿里云正式对外开放了这座超级智算中心的技术底座——飞天智算平台,其可通过公共云和专有云的模式服务于各类机构。开发人员可以在平台上进行数据存储、数据治理、数据分析、模型开发、模型训练与推理等。此外,平台还提供了预训练模型,语音、图像、自然语言处理、决策等领域的模型能力,以方便开发者更好地加速AI应用的开发。

  算力是这个时代的刚需。从政府主管部门到相关行业企业,都在为提升中国算力总量和水平,优化算力布局而努力。根深则叶茂,强劲算力能为人工智能的发展打下更广阔、更稳固的基础。

  推进智算基础设施建设

  算力是重要的基础设施,也是关键的生产要素。阿里云智能全球销售总裁蔡英华在飞天智算平台发布会上给出过这样几项数据:当下的中国,已经有58%的企业在使用人工智能,远远高于全球平均水平,领跑全球;数字化转型会带来大量的数据,预计到2025年,中国的数据量将达到486万亿亿字节。

  此外,我国的算力结构也在发生变化。“十三五”期间,我国算力总规模增长近5倍,通用算力增长3倍左右,智能算力增长近百倍,智能算力在整个融合算力中的占比达到了40%,未来可能会更多。“可以说,算力的发展不仅代表生产力水平的提升,还是产业革新的驱动力。”蔡英华说。

  和通用型计算不同,智能计算需要海量数据对AI模式进行训练,算力被损耗在数据迁移、同步等环节,这对智能计算提出了更高要求。因此,智算中心要具备高效算力、AI赋能、自主创新、绿色节能等多种特征,而建设智算中心,可以推进算力资源的优化配置,赋能各行各业的数字化转型,带动实现产、学、研、用多位一体,打造AI产业集群。

  工信部数据表示,截至2021年底,我国在用数据中心机架总规模达520万标准机架,在用数据中心服务器规模1900万台,算力总规模超过140 EFLOPS。全国在用超大型和大型数据中心超过450个,智算中心超过20个。工信部信息通信发展司司长谢存曾表示,工信部将持续推动算力基础设施建设,统筹布局绿色智能的算力基础设施,推进一体化大数据中心体系建设,加速打造数网协同、数云协同、云边协同、绿色智能的多层次算力设施体系,实现算力水平的持续显著提升,夯实数字经济发展“算力底座”。

  科研是智算中心的核心应用场景

  在生命科学领域,北京深势科技有限公司采用飞天智算平台之后,将集群性能优化提升超过100%,让分子动力学仿真模拟训练效率提升了5倍;在工业领域,智己汽车科技有限公司通过飞天智算平台提供的高性能计算,将智能驾驶训练效率提升了70%,加速了新车型的研发上市……这些只是智算中心服务于科学研究的一个缩影。

  阿里云智能副总裁、行业解决方案销售部总经理霍嘉直言,很多高校和科研机构的研究人员本身不是学计算机的,但他们的确需要人工智能来完成他们的研究,专业知识与互联网技术之间的隔阂,成为困扰研究人员的一大痛点。

  据阿里云大计算产品研发负责人曹政介绍,“相较于一般数据中心,智算中心除了对算力规模和效率的要求大大提高外,还需要为客户提供软件平台层的产品和服务,这是实现算力落地应用‘最后一公里’的关键。”曹政说。

  “如今,人们需要的是‘开箱即用’的智能计算服务,这是最真实的需求。”霍嘉表示,在AI开发层,该智算中心可以提供“大数据+AI”一体化平台支撑开发与运维全流程,尤其在模型训练环节,分布式训练框架可以对分布式策略进行自动组合和调优,将训练效率提升了11倍以上。此外,该智算中心还为用户提供了一站式的通用推理优化工具,可对算法模型进行量化、剪枝、稀疏化、蒸馏等操作,将推理效率提升6倍以上。此外,阿里云还同步启动了另一座位于乌兰察布的智算中心,其建设规模为3 EFLOPSAI算力。这两座超大规模的智算中心正在服务于AI大模型训练、遥感探测、数字人、自动驾驶、元宇宙等前沿智能应用。

  来源:科技日报