如何落地“东数西算”青云QingCloud给出答案!
“东数西算”全面启动,全国各地大力推进算力基础设施建设,“建好、管好、用好”面临重大挑战,青云科技助力打造新一代超级智算平台,实现算力中心健康发展。
需求与政策双重驱动中国算力健康发展
当前,新一轮科技革命和产业变革正在重塑全球经济结构。算力作为数字经济的核心生产力,成为全球战略竞争的新焦点。截至目前,我国数据中心规模已达 500 万标准机架,算力达到 130 EFLOPS(每秒一万三千亿亿次浮点运算)。随着数字技术向经济社会各领域全面持续渗透,全社会对算力需求仍十分迫切,预计每年仍将以 20%以上的速度快速增长。
从 2020 年 12 月发布《关于加快构建全国一体化大数据中心协同创新体系的指导意见》,到 2021 年 5 月印发的《全国一体化大数据中心协同创新体系算力枢纽实施方案》,再到 2022 年 2 月 17 日,国家发改委、中央网信办、工业和信息化部、国家能源局四部委联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等 8 地启动建设国家算力枢纽节点,并规划了 10 个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。
在需求与政策的双重驱动下,全国各地大力推进算力基础设施建设布局,超算中心、智算中心迅速成为新基建热点。
建好管好用好面对多项挑战
数字经济发展推动下,我国算力产业建设处于发展迅猛阶段。但与世界上计算产业成熟、算力水平领先的国家相比,现阶段我国算力产业要建好、管好、用好,还面临诸多挑战。
自主创新
国家信息化建设关乎社会经济与人民生活等多方面的发展,算力中心承载着许多科研开发、政府治理以及行业应用,因此数据安全尤其重要。在信息安全等级保护政策指导下,只有实现底层技术的自主创新,才能保证信息产业的稳定、健康发展。
硬件多样适配难
不同行业、不同场景对 IT 基础设施的要求越来越精细化,算力中心承载的业务越来越多样化,硬件逐渐朝多元化的方向发展,如何高效、统一地适配和调度这些硬件将会是一个巨大的挑战。
算力需求多样化
新一轮科技革命和数字产业变革带来的激烈竞争前所未有,科研开发、云计算、人工智能、大数据、区块链等新兴技术的高速发展,背后都需要算力的支撑。面对大量异构、跨平台的算力资源,如果无法形成统一的算力服务,那么用户将面对在多个平台间进行切换和使用,学习和运维成本极高。
应用开发及管理难
基础硬件设施和算力类型的多样化,必然也会导致底层算力平台的结构与技术差异化。平台间没有统一开发规范,开发人员在应用开发过程中,往往需要花费大量精力去适配不同的运行环境,以确保应用的可用性和稳定性,从而增大应用开发难度。
服务模式不够灵活
当前工业、医药等越来越多的行业,需要用到高性能计算来解决生产中遇到的问题。高性能计算服务缺少面向大众的服务运营平台的弊端就凸显了出来:资源池固定无法做到灵活调配、资源开通需要手动审批、共用登录点、资源抢占问题,用户在软件安装上也有诸多限制等。
运维难度高
无论是提供高性能计算服务的超算中心,还是传统数据中心建设规模都越来越庞大,结构越来越复杂。运维这些大型异构算力平台,继续采用传统的人力运维,已经很难赶上算力中心的建设步伐。
迎接下一代“算力创新”
原有的算力基础设施,更多是针对不同场景特点打造专用的算力平台,如传统的超算中心、云计算中心,它们并不能很好地在统一的管理框架下同时满足多种算力需求,并且解决以上各种挑战。基于此,青云科技提供了全新的解决方案,打造了新一代的超级智算平台。
超级智算平台
青云科技以基于虚拟化、容器等技术实现对算力与底层基础设施的解耦,通过统一的云操作系统对底层资源进行纳管和协同编排,构建了支持多元算力的超级智算平台,实现多元算力的统一协调管理及协同工作,最大化地发挥多元算力的作用。
自主创新的算力平台
当前“新基建”与“数字经济”背景下,算力中心将会发展为国家的数字中心枢纽,这当中算力平台作为 IT 基础硬件设施的融合层,毫无疑问是重要的一环。
青云与众多信创芯片、操作系统、服务器、数据库、中间件等上下游厂商达成深度合作,积极完成产品的兼容适配。超级智算平台能够提供全栈信创云计算的服务能力,屏蔽底层信创硬件差异,帮助企业从零构建 laaS、PaaS 并提供一整套应用开发、交付与运营平台。
云计算赋能多元算力一站式交付
青云超级智算平台利用云计算技术实现对多种主流的 CPU、GPU、NPU、FPGA 等异构算力统一分配和调度,并且具备将异构算力统一封装提供服务的能力。利用云计算技术为算力中心赋能,一站式提供多种算力服务:通用云计算服务、高性能计算云服务、AI算力服务。
超级智算云原生平台
青云超级智算平台基于 KubeSphere 构建了以应用为中心的分布式、多租户、多集群、企业级容器平台,具有强大且完善的网络与存储能力,并通过极简的人机交互提供完善的多集群管理、CI/CD、微服务治理、应用管理等功能,与 HPC 平台相融合,在云、虚拟化及物理机等异构基础设施上快速构建、部署及运维容器架构,实现应用的敏捷开发与全生命周期管理。
应用商店支撑统一应用交付
青云超级智算平台以融合架构计算系统为平台,以数据为资源,能够以多元算力驱动计算模型对数据进行深度加工,源源不断产生各种智慧计算服务,集成各场景业务软件,通过统一的应用商店,支撑各行各业应用场景。
目前,应用商店中已集成涉及生物信息与生物学、大气海洋环境、机械工程、数学库、化学工程、程序语言、编译器、MPI 等多种业务场景、多类学科、多种程序语言的应用软件,平台软件库规模已达 300+,其他各类应用场景软件还在不断更新中。
依托 IoT 物联网技术打造智慧数据中心
青云QingCloud 借助数字化技术,利用一整套贯穿数据中心的规划、设计、建设、运维全生命周期的智慧化管理方法来支撑,设计智慧数据中心解决方案,打造全数字化的数据中心智能管理平台。
依托 IoT 物联网技术可以对海量设备进行数字化管理,实现基于物联大数据的全景智算中心监控,围绕 IDC 设施管理、能耗与动环管理、智慧运维、智慧运营四大板块,建设“统一管理、智能联动、流程规范”的开放能力平台,实现超级智算中心的智慧化赋能,从硬件和软件、技术和管理多个层面促进数据中心能效提升。
国家超算济南中心的创新发展之路
自 2019 年起,国家超算济南中心实施规划——打造全新的百亿亿次异构融合算力平台,以满足日益旺盛的“新基建”需求。目标是迅速聚集各类创新资源,持续完善超算应用服务产业生态链,满足人工智能产业的全方位需求,一站式提供多种算力平台,打通“产”、“学”、“研”环节的快速转换通道。同时也为后续的算力网络发展做好布局。为国家超算济南中心打造新一代超级智算平台的重任荣幸地落在青云科技身上。
青云科技为国家超算济南中心打造的新一代超级智算平台实现了融合多种异构算力平台、一站式统一管理、跨平台的便捷应用部署,这些特点都为济南超算中心提供全面、优质的数据服务提供了良好的基础,也可以为其他超算中心的发展起到示范性作用。
算力已成为国民经济发展的重要基础设施。加快推动算力建设,将有效激发数据要素创新活力,加速数字产业化和产业数字化进程,催生新技术、新产业、新业态、新模式,支撑经济高质量发展。青云科技积极布局和参与,打造新一代超级智算平台解决方案,帮助社会建好、管好、用好算力基础设施。(CIS)