来源 :上证e互动2023-03-27
海天瑞声(688787)请问贵司除了主要提供训练数据用于主流AI,是否也拥有基础数据,拓尔思日前披露拥有1300亿条基础数据,日均增加1亿条,请问贵司目前拥有多少基础数据,是否每日增加中?训练数据与基础数据在AI中的重大应用有哪些方面?
尊敬的投资者:您好,1、公司是专业的人工智能训练数据服务提供商,公司生产结构化训练数据所需的原始数据来源为在真实世界组织采集的各类形态样本数据(包含语音、图片、视频、文本等),亦或是客户侧提供的其AI产品上线后产生的实网数据。截止目前,公司自有知识产权的标准化产品数据集及为客户定制的数据集累计几千个,覆盖大量智能语音、计算机视觉、自然语言类型的原始数据,在AI训练数据领域处于领先地位。2、按照我们理解,上述这些原始数据以及据此形成的训练数据集与您所描述的“基础数据”在来源、性质、用途等方面可能存在较大差异。在当前AI深度学习技术路线下,经过高浓度采集及高质量标注的结构化数据是支撑AI算法模型进行机器学习的核心要素,公司的交付物即主要为经过全流程(设计、采集、处理、质检)或部分流程砺炼的专业训练数据集,旨在为各类AI算法模型开发提供支撑。