公司是国内领先的训练数据专业提供商。海天瑞声成立于2005 年,主要从事训练数据研发设计、生产和销售业务,其训练数据应用于人工智能算法模型的开发训练,涵盖了智能语音、计算机视觉、自然语言等多个核心领域,服务于人机交互、智能驾驶、智慧城市等多种应用场景。目前公司客户累计数量已超500 家,覆盖了主要的大型科技公司(阿里、腾讯等)、人工智能企业(科大讯飞、海康威视等)和科研机构(中科院)等。2020 年公司营业收入为2.3 亿元,毛利率、净利率分别为67.70%和35.17%。
AI 基础数据服务市场规模稳步提升,未来品牌数据服务商或占优。算法、算力和数据是人工智能产业链中技术发展的三大核心要素,训练数据是算法模型发展的基础。2019 年,我国AI 基础数据市场规模达到30.9 亿,预计2025 年将超过100 亿元,复合年增长率超过20%。在细分需求中,图像类数据需求占比近一半。中国AI 数据服务市场参与主体包括学术机构、政府等中立机构、需求方自建基础数据团队、基础数据服务商。2019 年,基础数据服务商中的数据供应商占据近半壁江山;以公司为代表的前5 大企业市场份额超过1/4。
随着业务门槛的提升、客户需求多样化等情况,中小型数据供应商或面临经营困境,艾瑞数据显示,2019 年中小型数据供应商份额比预期值缩小了20.8%,这部分按7:3 让渡给品牌数据服务商和需求方自建数据团队。
公司多年深耕基础数据服务行业,市场份额占优,技术实力和人才储备具备优势。公司是我国最早的基础数据服务公司之一,积累了丰富的行业经验,为下游客户提供高质量数据产品和定制服务,赢得了如阿里巴巴、腾讯、百度等众多大型优质客户的认可,目前在国内的市场份额位居行业前五,在品牌效益和业务能力方面均有较强的竞争优势。与可比公司对比中,公司营收等弱于Appen,但在训练数据覆盖的语种/方言覆盖能力、成品训练数据集储备数量等方面优于慧听科技、标贝科技。公司积极钻研核心技术,培养了优秀的行业人才,技术横跨基础研究、平台工具和训练数据生产等三大领域,成为公司提供相关产品和服务的重要支撑。
募集资金助力公司发展。公司本次发行公司股份1070 万股,实际募集资金总额为3.95 亿元,主要用于自主研发数据产品扩建、一体化数据处理技术支撑平台升级、研发中心升级建设等项目,拓展公司训练数据产品覆盖的场景和领域,提升公司服务效率,增强核心竞争力。
盈利预测、估值。我们预计公司2021-2023 年营业收入增速分别为8.1%、16.7%、20.6%,归母净利润增速分别为1.3%、19.2%、24.6%,预计EPS 分别为1.94、2.32、2.89 元。估值方面,公司可比公司有Appen、慧听科技、标贝科技等;其中,慧听科技、标贝科技均未上市,Appen 为澳洲上市公司。Appen2020 财年收入为6 亿澳元,净利润为5051 万澳元,8 月11 日市值为15.24 亿澳元,以此计算PE(2020)约为30 倍。公司目前收入体量与Appen 还有较大差距,但净利率远高于Appen。考虑到公司在AI 基础数据行业的技术与市场优势,我们给予公司2021 年30 倍PE,对应目标价约为58.2 元/股。
风险提示:募投项目推进进程存在不确定性、行业竞争加剧。