国内领先的AI 模型训练数据提供商。公司成立于2005 年,专注于将自然数据源专业化加工为可供AI 公司训练使用的工程化数据集,可谓AI 算法的“加油站”,已经覆盖微软、腾讯、百度、科大讯飞等头部AI 企业客户。公司核心团队具备学术与行业背景,为公司长期发展打下坚实基础。虽然疫情带来短期扰动,但公司收入利润整体持续快速增长,2016-2020 年营业收入CAGR 为29.02%,归母净利润CAGR为68.06%,标准化程度较高的数据库产品收入占比持续提升至21Q1 的56%,毛利率近年来稳定在约70%。
AI 商业化打开数据服务市场百亿级空间,算法迭代、场景创新驱动行业成长,有望带来市场集中度提升。1)AI 已进入全方位商业化阶段,全球产业规模超500 亿美元,国内市场规模超400 亿元,中国AI 基础数据服务市场处于快速成长期,2025年有望突破百亿规模。2)AI 基础数据服务上承数据生产者,下接AI 应用方,是AI落地过程中不可或缺的一环。我们认为,机器学习算法迭代的天然需求与应用场景的创新是AI 基础数据服务行业扩张的主要驱动力,一方面专业化的训练数据是当前AI 算法发展迭代的刚需;另一方面深度学习模型对训练数据的数据量、多样性和更新速度方面提出较高要求,需要专业数据商提供服务;此外,智能物联网、产业互联网等新型场景催生增量新需求。3)当前AI 数据服务市场行业集中度较低,2019年CR5 仅26.2%,未来随着市场需求向精细化转型,我们预计市场集中度将进一步提升。
一体化平台的根基是算法、资源和经验,数据积累带来规模效应和粘性,多领域、多语种能力打开成长空间。1)公司基于核心算法打造“从设计到质检”的一体化平台,赋能数据生产全流程,高效实现大规模数据加工质检,形成核心技术壁垒,我们认为竞争优势背后是技术、资源以及对垂直行业的理解。2)“数据积累—技术迭代—提升数据质量”的闭环带来明显的规模优势,对垂直行业Know-how 的理解拓宽公司的竞争护城河,而头部客户的高复购率也显示了产品的高粘性,进一步带动公司对行业Know-how 的理解。3)产品能力涵盖智能语音、计算机视觉和自然语言3 大领域,自有训练集数据产品数量位居行业领先。虽然短期受到疫情扰动,但是我们认为多领域多语种的覆盖能力将打开公司的全球化成长空间。
首次覆盖,给予“买入”评级,2022 年目标市值72 亿元。我们预测公司2021-2023年收入分别为2.82/3.99/5.47 亿元,对应归母净利润0.84/1.18/1.61 亿元;横向比较的AI 公司的2021 年PE 均值约为61 倍,考虑到公司在AI 数据训练行业的稀缺性,给予2022 年目标市值约72 亿元,给予“买入”评级。
风险提示:AI 产业景气度下降;市场竞争加剧;海外贸易摩擦风险;新冠疫情恶化的风险。