计算机行业中报业绩披露期已进入尾声。
从目前已披露业务的企业情况看,继一季报板块出现显著分化表现后,计算机板块的业绩分化正在延续。受下游行业需求恢复较为温和的影响,计算机行业很多公司Q2业绩表现不佳,但也有少数的细分领域龙头表现亮眼。
比如大数据基础软件龙头星环科技(688031.SH),于上半年实现营业收入1.38亿元,同比增长41.38%。在今年的计算机行业中报季里称得上是一份A+级财报了。
与低迷的中报形成鲜明对比的是,自年初以来,计算机行业主线迭起,相关市场一直异常热闹。
外行人看热闹,往往是“概念股”繁多,但是真正的核心受益股却不多。加上对于非计算机行业的投资者来说,各种眼花缭乱的专有名词也形成了很大的阻碍。计算机领域太专业了,涉及的技术、产品和行业繁多,不同技术下不同的产业链层级在不同行业中的竞争格局完全不一样。
值得肯定的是,计算机行业正处于黄金窗口期。但要在计算机板块中寻找“确定性”很难,如同迷雾里开车。
不过,如果换个角度,从成功的案例出发寻找共性,或许能更简单。
当前,数据基础软件到了关键的十字路口,行业中过去粗放式的经营模式难以为继。昔日的数据库产业旧气象正在被打破,焕然一新的新气象正在到来。
让我们从星环科技的中期成绩单出发,看一个大数据基础软件龙头做对了什么。
存量市场迎来颠覆
不少业内人士认为,未来数据基础软件相关行业会沿着两个方向发展:
一是存量市场的国产替代将步入高质量竞争阶段,二是新技术与新需求迭起,为增量市场持续带来机遇和挑战。
近年来,我国在终端和应用领域的国际竞争力大幅度提升,但操作系统、基础软件等方面的自主创新水平依然存在较大的提升空间。其中,数据基础软件既要向下调用硬件基础资源,承接文本、图像、声音等数据源,又要向上为应用软件提供重要数据支撑,是信息化核心环节。
自从国资委79号文件、《全国一体化政务大数据体系建设指南》等利好政策出台,明确指出2027年前完成2+8+N的党政与八大重点行业100%国产替代后,从0到1的替代之路已经开始。而根据赛迪顾问的数据显示,国产替代已初见成效,四大外商市场份额三年下降20.8%,但目前整体国产信息化渗透率仅约10%,尤其是数据基础软件等基础软件领域尚处于发展初期。招商证券研究所指出,未来国产数据库蓝海市场的市场规模将达到600亿。
政策出台后,市场上如雨后春笋般地涌现出数百家所谓的“自主可控”的数据库公司。这些企业标榜为国产,顶着“自主创新”的名头,其底层架构却是基于美国的开源数据库。它们往往通过在开源数据库的基础上稍加改动,就将其再包装后投放市场。
从安全角度来看,这些国产数据库不是完全自主可控的。从市场竞争的角度来看,产品并没有如它们声称的那样完全自主研发或创新,既难以满足越来越高的用户需求,又存在着同质化竞争。
目前,我国的关系型数据库主要基于MySQL(被美国甲骨文收购)、PostgreSQL两大美国开源数据库进行二次开发,非关系型数据库主要基于开源数据库如Redis、InfluxDB、CouchDB等产品进行二次开发。但目前形势正在改变——开源数据库正在逐步走向闭源,导致二次开发的时间以及人力成本会不断增高。而在大数据平台产品方面,大部分的国产厂商会在分布式数据处理的平台CDH与HDP的基础上包装成产品对外提供。
大数据平台产品的僵局率先被打破,简单的“拿来主义”模式难以为继。2022年3月CDH/HDP全部停止服务(EoS),CDH 6和HDP 3将是CDH和HDP的最后企业版本,企业版用户无法继续获取新的功能和性能提升。企业用户要继续使用,必须转向订阅费用高昂的Cloudera软件。这意味着,大数据平台产品市场上的绝大部分的竞争对手原有路径再也行不通了。
在这样的背景下,星环科技凭借着“真正自研"的优势杀出重围。始终坚持“自主研发、领先一代”的技术发展策略,自研技术包括关系型分析引擎、实时流处理引擎、容器云技术、数据云服务、多模型数据统一处理技术等。
针对数据库产品线,星环科技分布式分析型数据库ArgoDB6.0可以在批处理和OLAP、Ad hoc分析等场景,替代Oracle、DB2、Teradata、SAP HANA等国外产品。分布式交易型数据库KunDB 3.2可以在交易型OLTP的业务场景、高并发在线数据服务场景等,替代Oracle/DB2/MySQL。
以公司重要产品大数据基础平台TDH为例,多年来TDH主要组件不断由开源体系向自研体系转换,已不再依赖海外开源技术,并已积累大量针对CDH与HDP的迁移成功案例。事实上,星环科技的原创率在国产大数据平台中算得上数一数二。根据工信部电子第五研究所代码扫描测试报告,大数据平台TDH的1200万行代码里自研代码率超过70%。TDH可通过10种存储引擎,共支持11种模型的数据统一存储管理,并支持使用统一查询处理语言完成跨模型数据流转与关联分析。
高度自主可控、较强迁移能力,以及较强的服务能力,使得星环科技有望占据较大市场份额。根据财报,星环大数据基础平台的收入持续高增,构成公司的增长基本盘。2023年上半年,大数据与云基础平台业务的收入为3,299.08万元,同比增长36.90%。
2023年,我们有望迎来第二轮信创周期。第一轮信创集中在党政两个领域,替换数量和范围有限;第二轮信创将扩散至8+N行业,不仅从总体数量上将是第一轮的5-8倍,采购模式也将从“频次低、批量大”向“频次高、批量小”转变,“常态化”的采购对于业绩的确定性更为“友好”。
星环科技在金融、政府、能源、电信、交通等“8+N”行业已深耕多年,打造了较多的标杆案例。报告期内,公司还详细制订公司合作伙伴架构体系,根据不同类型的合作伙伴(制定不同的合作策略及方法,成功开拓了数十家金融、教育、交通、医疗、能源、政府等行业ISV和区域经销商,为其在第二轮信创开疆扩土奠定坚实基础。
增量市场或超预期
数十万亿级数据要素市场拉开帷幕
当前,数据要素市场正在加速拉开帷幕。7月底,数据局局长官宣,数据局高层人员已基本就位,这意味着国家数据局开始进入实质性运行阶段。8月21日,财政部正式对外发布《企业数据资源相关会计处理暂行规定》。该规定将企业数据资产纳入会计报表的会计确认、计量、记录和报告等进行了细化。东吴证券认为,数据资产政策落地节奏超预期,标志着国家把数据作为生产要素的坚定决心。
根据公开数据,北上深广等多地也在推进数据交易所建设。据不完全统计,全国新建各类数据交易机构80多家,全国副省级以上政府提出推进建设数据交易中心(所)的30余家,全国一体化数据要素市场体系逐步成型。
数据要素市场正面临从0到1的重大拐点。
国家发展改革委专家王建冬指出,我国拥有海量数据规模和丰富应用场景优势,激活数据要素潜能,对做强做优做大数字经济具有重要意义。短期来看,数据基础制度将催生3000-5000亿元规模的数据交易市场。而从中长期看,数据资产相关市场潜在规模将在30万亿元以上。
公共数据占据全社会数据资源总量的80%左右,将成为最重要的、最先进入市场的数据要素。公共数据是指政务部门、公益事业单位以及供水、供电、供气、公共交通等公用企业在依法履行职责或者提供公共服务过程中收集、产生的各类数据及其衍生数据,具备很高的敏感性。因此,如何在数据高效开放的同时保护隐私和公共安全,是贯穿公共数据价值释放始终的难题。
为此,星环科技推出诸多产品为公共数据的开发和流通保驾护航。2023年上半年,针对大数据开发和智能分析工具产品线,推出了数据要素流通产品Navier 3.1,使数据流通更安全、更可控和更便利。其中,安全沙箱Sandbox,打造封闭、隔离的数据开发分析环境,开发人员在安全隔离的环境下进行分析计算,不可下载和导出原始数据集,以保证原始数据不出域;隐私计算平台Sophon P2C 2.0,在保证数据提供方不泄露敏感数据的前提下,数据消费方对密文数据进行分析计算,保障数据以“可用不可见”的方式进行安全流通,消除潜在安全风险,实现数据要素价值的安全释放;数据安全防护工具Defensor4.0,在数据分类分级模块中创新型地引入了大模型技术用来解决分类分级中短文本语义语境识别率低的问题,在有标注样本的前提下,识别准确率达到了95%。
根据半年报,星环科技的数据开发与智能分析工具软件业务收入同比大幅增长202.96%。随着星环科技积极加入数据要素交易市场,相关业务的潜力有望进一步释放。
AI2.0时代的星辰大海
如果说,上一轮的人工智能革命以机器视觉识别技术为代表,那么AI 2.0时代则以ChatGPT为代表。
市场普遍认为,ChatGPT之于AI行业的发展,如当年的iPhone之于智能手机。iPhone的诞生后,我们迎来了智能手机和移动互联网的黄金发展期;ChatGPT问世后,将推动AIGC奇点无线临近。“AI的iPhone时刻”正在到来。
数据基础技术不仅仅将用于数据的存储和管理,还能够帮助人工智能模型进行智能化数据处理和分析,是AI新浪潮的重要组成部分。星环科技作为国内基础软件领域的领先企业,在本次新浪潮中反应迅速。5月,星环科技在“向星力·未来数据技术峰会(FDTC)”上发布了两款大模型——金融大模型“无涯”,以及大数据分析大模型SoLar“求索”;还推出了大模型训练工具Sophon LLMOps、向量数据库Hippo等创新产品。
其中,向量数据库Hippo不同于传统关系型数据库,是一款自主可控的云原生分布式向量数据库,支持存储、索引及管理海量的向量式数据集,能够高效解决向量相似度检索等问题,拓展了大模型的时间和空间维度。
另外,星环科技两款自研的行业垂类大模型也具备可观的应用价值。金融大模型“无涯”是一款面向金融行业、超大规模参数量的生成式大语言模型。“无涯”建立在星环科技深耕金融行业多年的基础上,具备对包括基本面、技术面、消息面在内的金融通识领域的准确理解能力,能构建包括政策、舆情、ESG、风险、量价、产业链在内的六类大模型基础因子库。另一个大模型“求索”,是针对大数据行业全生命周期各种场景的大数据领域大模型。可以使用自然语言描述涉及多种数据模型的复杂业务需求,让非专业用户在不需要学习和掌握数据库编程语言的前提下通过自然语言自由地按需查询数据。
星环科技在半年报指出,两款大模型旨在分别促进金融分析和大数据分析的平民化,这有利于推动计算普惠和AI普及。
东方证券研究所指出,星环科技将分布式向量数据库和分布式图数据库以及知识图谱结合,与大模型可视化端到端构建工具一起,提供了知识抽取融合、知识建模、知识图谱生成存储、基于大模型的知识问答等闭环功能,可以构建业务域知识图谱和业务系统的应用服务,有望激发出更多更深入的业务场景AI应用。不难看出,目前星环科技的AI生态的雏形已经渐现。
从半年报出发,我们可以看到在这个关键的节点,星环科技是如何将自身优势发扬光大,并成功把握住“信创+数据要素+AI”东风。凭此公司不仅不畏低迷期,还走出了靓丽的增长曲线。
而中报业绩潮的到来,也给了市场进行“去伪存真?”的机会。无论是从安全边际的维度说,还是从长期价值的角度看,在催化因素之下有产品落地、有业绩释放的公司将走得更远。