来源 :中证网2021-08-13
中证网讯(王珞)8月13日,北京海天瑞声科技股份有限公司(以下简称“海天瑞声”)正式登陆上交所科创板。此次海天瑞声IPO共计发行新股数量1070万股,发行价格为36.94元/股。
招股书显示,本次IPO发行募集资金扣除发行费用后,海天瑞声拟分别投向自主研发数据产品扩建、一体化数据处理技术支撑平台升级、研发中心升级建设和补充流动资金四个项目。公司表示,项目建成后,公司技术水平、业务规模、产品体系等方面都将得到显著完善。
深耕AI基础数据服务领域打造训练数据服务标杆企业
海天瑞声表示,近年来,全球人工智能产业规模快速增长,基于深度学习的智能语音、计算机视觉、自然语言处理等技术开始向各个应用领域渗透,数据是人工智能行业发展的三大核心要素之一,优质、丰富的训练数据对各类应用落地及算法模型的迭代尤为重要。随着人工智能技术研究及应用产业化落地的加速,人工智能技术和应用对于训练数据服务的依赖有明显增强的趋势。商业化进程的演进,新兴应用场景如智联网AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进AI技术和算法模型的优化和创新。因此,在创新应用场景和新型算法的带动下,具有前瞻性的训练数据产品和高定制化的训练数据服务需求将逐步成为主流,而专业化的训练数据服务提供商也将在AI产业链上扮演更加重要的角色。
公开资料显示,海天瑞声是我国最早进入AI基础数据服务行业的企业之一,也是目前我国语音类数据资源市场份额最大的企业。自2005年成立以来,公司始终致力于为产业链上的各类机构提供算法模型开发训练所需的数据集,已成为我国领先的训练数据专业提供商。经过多年的业务实践与发展,海天瑞声目前与产业链上的各类机构都建立了长期的战略合作关系,训练数据相关的产品和服务获得了包括阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、字节跳动、中国科学院、清华大学等在内的众多大型优质客户的广泛认可,并应用于个人助手、智能音箱、语音导航、搜索服务、智能驾驶、机器翻译等多种产品相关的算法模型的训练过程中。公司在核心技术、行业经验以及专业服务能力等方面均处于行业领先地位,是具有国际竞争力、领先性的标杆企业,彰显了在基础数据服务行业的影响力。
掌握自主研发国产化技术生产体系夯实训练数据建设服务能力
招股书显示,凭借多年的研发积累与持续创新,海天瑞声依托其100%自主研发的国产化技术体系、生产体系,自主开发了一体化数据处理平台,在基础研究、平台工具、训练数据生产三个维度均积累下核心技术,有机搭建起海天瑞声的训练数据开发一站式解决方案,提升了开发效率、服务质量及数据安全性,为下游客户提供了高质量的训练数据产品、高效率的训练数据定制服务及高水准的训练数据相关应用服务。
据了解,海天瑞声拥有对AI核心算法的理解能力、前瞻性的专业训练数据集设计能力、丰富的语言覆盖能力及场景采集能力,以及AI辅助标注及精细标注能力。公司已逐步建立训练数据生产领域技术壁垒和竞争优势,积累掌握了12项核心技术,广泛运用在训练数据生产的各个环节之中。通过算法与数据处理技术并用,实现高效的数据加工及质检,充分提高了训练数据的生产效率及质量控制水平,保障了数据安全;在语音语言学基础研究领域公司建立了成熟的发音词典构建流程,积累了深厚的语音语言学基础研究成果,语言覆盖能力行业领先,产品和服务已覆盖全球160余个语种/方言,构建起多语种训练数据生产服务能力,为大规模、高质量、工程化的训练数据资源产出奠定基础,并对带动人工智能行业训练数据建设与数据资源的优质发展起到了引领作用。
赋能AI技术与实体经济深度融合助推基础数据服务产业新发展
海天瑞声此前公告显示,公司目前已覆盖智能语音、计算机视觉、自然语言处理三大人工智能核心技术领域,产品和服务范围更是覆盖语音识别、语音合成、发音词典、图像与视频识别、手写体识别、光学字符识别、语义理解、机器翻译等多个技术方向。
招股书显示,截至2020年12月31日,海天瑞声已拥有760余个自主知识产权的可授权使用训练数据产品,并向下游客户提供了累计超3600次/个训练数据定制服务或训练数据产品。这些产品和服务可覆盖生活交流、客服、家居、办公、行车、普通环境、噪声等多种特定场景中的语言现象和视觉呈现,构建成独具特色的训练数据集合,已应用于智能助理、智慧交通、智能搜索、智能家居、自动驾驶等16类应用领域,有效推动人工智能行业各类终端产品及应用的落地和优化,赋能人工智能技术与实体经济的深度融合。
海天瑞声表示,上市之后,公司将继续聚焦训练数据领域,依托技术创新手段和系统开发能力,打造和提升高品质服务体系,强化数据资源优势,以高品质的产品服务响应AI产业落地与数字经济的主旋律,实现AI应用领域的新拓展。增强并探索数据驱动行业发展的能力,全面激发和带动基础数据服务的创新活力与高速发展。