来源 :北青网2023-12-05
中国信通院《中国综合算力指数(2023年)》显示,近5年我国人工智能算力在整个算力结构中的占比已经超过25%,同比增加60%。未来算力仍会保持高速发展,尤其是智能算力将成为未来算力增长的主要动力。
毫无疑问,云计算作为AI算力不可或缺的基础设施,AI算力需求的爆发正在为云计算市场带来更多增量。有业内人士认为,随着企业对AI投入占比的持续增加,对于底层算力的需求,会带来10倍乃至100倍的市场规模增长。
在青云科技总裁林源看来,AI为云计算打开了全新的增量市场,并且会带来一波长达10年以上的市场需求,这正是青云新一轮竞争的机会。
但机会总是伴随着挑战,AI技术催生的新市场,从客户需求到对算力、应用、底层架构的要求,都发生了巨大的变化:
过去数字化转型,企业应用以传统应用为主,如今以云原生和AI应用为主;过去企业对于底层算力以CPU为主,如今变成了CPU、GPU异构多元算力;过去互联网业务主要是延迟敏感型应用,但如今企业会兼顾成本型应用,业态变得更加丰富。
这些变化对技术和平台挑战越来越多,也让几乎所有的云服务商重新回到同一起跑线,争夺AI算力这一新增市场。
那么对于青云科技来说,发力AI算力,到底有多少胜算?
在智算中心高速扩张的早期阶段,由于缺少统筹规划和技术经验,项目失败不在少数。某大厂斥巨资建设的智算中心,由于只支持国产GPU,上线时发现很多应用根本无法支撑,导致整个智算中心无法投入运营。与之类似的还有超算中心想要兼顾智算中心的功能,虽然超级计算机提供高精度算力,但却是为科学计算、超算等场景而生的,对于AI所需要的大规模、低精度算力并不适用,因此这一想法也并不现实。
不难发现,智算中心并不缺建设者,关键挑战反而是在建设后的运营阶段,谁能更好地解决这一难题,谁就能优先拿到AI算力的门票,而青云科技无疑是其中的佼佼者。
2019年,国家超级计算济南中心实施规划——打造全新的百亿亿次异构融合算力平台,以满足日益旺盛的“新基建”需求。青云科技作为唯一的算力调度平台供应商,为国家超算济南中心提供了“一个平台纳管多种算力服务、一站式统一管理、跨平台便捷应用部署”的算力运营服务。
作为当时全亚洲最大的计算中心之一,国家超算济南中心拥有1000P的算力、超 300 PB的存储,打造的算力服务包括HPC超算、传统云计算(以CPU为主)、智算(兼顾国外及国产 GPU),是一个名副其实的多元且异构的算力中心。
这样一个庞大的复杂体系,必然对平台建设方和运营方提出了极高的要求。据林源回忆,当时从底层的芯片、服务器、存储、交换机、安全设备到上层的云平台,业内几乎所有顶尖的厂商都参与其中,但整个项目的算力调度运营平台是由青云独家供应的。
在算力调度上,青云科技屏蔽了超算服务器、AI服务器、通用服务器等多种异构基础设施的差异,向下接驳异构化的算力和硬件平台,实现对算力的统一纳管、调度、配给和全生命周期管理,进而向上支撑各种行业应用,为传统HPC科研计算、政务云、智慧城市等AI应用提供完整的算力服务。
如今,国家超算济南中心已稳定运营3年,且已经开始盈利,成为国内多元算力中心成功运营的典范。尽管这种成功看起来毫不费力,但背后其实凝结了青云科技长期以来的技术积累和运营经验。