【AI训练数据研发生产企业】公司主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。公司始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。经过多年发展,公司已成为人工智能基础数据服务领域具有较强国际竞争力的国内头部企业,并实现了标准化产品、定制化服务、相关应用服务全覆盖。公司所提供的训练数据涵盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能家居、智能驾驶、智慧金融、智能安防等多种创新应用场景。另,公司是国家专精特新“小巨人”企业。
更新时间:2024-04-26 09:47:59
【拟定增募资6.66亿(终止)】2024年4月,公司决定终止2023年度向特定对象发行A股股票事项。公司原拟向不超过三十五名特定投资者发行12,065,036股(含本数),募集资金总额不超过66,600.00万元(含本数),扣除相关发行费用后将用于投资AI大模型训练数据集建设项目、数据生产垂直大模型研发项目。
更新时间:2024-04-26 09:47:56
【人工智能训练数据服务提供商】2024年3月15日公司在互动平台上披露:公司是专业的人工智能训练数据服务提供商,目前正在围绕AIGC/大模型数据服务领域进行投入、建设。一方面,公司将基于现有商业模式,开发大模型相关的专业训练数据集,该数据集建成后,将提供可供大模型训练和评测的不少于10个品类的专业数据集,显著提升行业内面向大模型训练数据集的类别和质量,协助实现公共数据、社会数据等各类高价值数据资源汇聚,实现基于大模型通用能力和垂直领域数据的训练学习。另一方面,公司计划将研发设计数据生产垂直大模型,公司全栈自研的数据生产垂直大模型,将可辅助完成面向多个下游任务的数据设计与处理规则,形成包括数据清洗方案设计、指令方案设计、指令泛化与迁移、指令数据验证、多模态数据方案等在内的多项生成能力,以及在上述方案下的原始数据及标注成果生成能力。 公司已与相关客户签订了大模型训练数据集相关的业务合同或意向订单。此外,公司已与其他大模型领域的知名机构签署了合作协议,未来拟围绕人工智能大模型数据处理技术、大模型数据集供给和大模型评测等方面进行合作。
更新时间:2024-03-25 08:31:28
【实控人提议1500万-3000万回购股份】2024年2月,公司控股股东、实际控制人、董事长贺琳女士提议公司通过集中竞价交易方式进行股份回购,并在未来适宜时机全部用于股权激励或员工持股计划。本次回购股份的用途:在未来适宜时机全部用于股权激励或员工持股计划。回购股份的资金总额:不低于人民币1,500万元(含),不超过人民币3,000万元(含)。
更新时间:2024-02-26 10:02:36
【标准化数据集产品 】标准化数据集产品,是公司区别于众多竞争对手以定制化服务为主的特有商业模式,也是公司核心竞争力之一。截止2022年末,公司新增研发超400个训练数据集产品,自有知识产权的训练数据产品储备超过1,300个,尤其在多语种及多音色语音数据集和发音词典、动作捕捉等多模态数据集、以及多语种OCR和手写体数据集等方面积累了更丰富的标准化产品资源。公司已向下游客户提供了累计约6,000次/个定制或标准化训练数据集,可覆盖生活交流、客服、家居、行车、办公、普通环境、噪声等多种特定场景中的语言现象和视觉呈现,构建成独具特色的训练数据资源及服务能力集群,并已应用于个人助手、语音输入、智能家居、智能客服、机器人、语音导航、智能播报、语音翻译、移动社交、虚拟人、智能驾驶、智慧金融、智慧交通、智慧城市、机器翻译、智能问答、信息提取、情感分析、OCR识别等19类创新应用领域,赋能人工智能技术与实体经济的深度融合。
更新时间:2023-12-08 11:37:25
【为AI公司开发训练所需专业数据集】公司专注于为包括AI技术公司在内的AI产业链各类机构提供算法模型开发训练所需的专业数据集。2023年3月15日,公司在投资者互动平台表示,无论是传统模型还是大模型的迭代、发展都依赖高质量的数据供给。以OpenAI研发的ChatGPT为代表的大模型带来了AI产业的新变革,在诸如强化学习以及垂向场景拓展方向预期将会产生新的增量数据需求。公司将会持续、密切关注该领域的发展趋势,积极跟进和对接境内外产业链上各类客户的新需求,并适时推进公司标准化数据集产品创新、技术创新,力争持续满足相关客户的数据需求。
更新时间:2023-06-21 13:38:49
【训练数据全球化业务】受益于境外企业全球化扩张以及虚拟人、多语言扩展、软硬件升级等研发及业务方向的发展,多语种多模态数据业务需求呈现快速增长趋势,公司凭借多年来在语言研究、发音词典、语音、计算机视觉以及自然语言方面的技术储备,赢得了境外客户信赖,相关订单数量显著增长。此外,为更好应对境外数据服务市场的复苏,公司也逐渐增强境外销售团队建设、增设境外本土销售人员,重启包括Interspeech、ICASSP等在内的海外研讨会及行业展会并深度参与,从而向全球市场展示公司先进技术实力及前瞻性产品积累,提升行业影响力;同时,利用搜索引擎、社交媒体、品牌宣传等多类渠道进行推广,提升海外市场及主要客户的认知度。
更新时间:2023-06-21 13:38:41
【平台与算法能力】海天瑞声自主研发的一体化数据处理平台,可实现智能语音、计算机视觉及自然语言等AI领域全覆盖,其中服务智能驾驶的第四代VDS平台目前可覆盖全部舱外场景、主流传感器以及多类前沿的数据处理需求。公司凭借近20年数据服务经验以及丰富的数据积累,在智能语音、计算机视觉、自然语言等方面储备了大量的优质算法模型,截至报告期末,公司算法模型数量已增至200余个。算法能力的引入极大提升了公司人机协作效率,也是行业内各企业拉开成本差距的核心驱动因素之一。
更新时间:2023-06-21 13:38:38
【智能驾驶行业数据服务业务 】2022年公司凭借逐步积累起来的行业领先的技术平台以及优质的服务品质,开始获得客户认可,2022年,公司智能驾驶客户数量超过50家,覆盖传统车企、新势力车企、智能驾驶技术公司等。2022年,为更好抢抓智能驾驶发展机遇,公司建立独立的智能驾驶事业部,并从研发、技术、业务、销售等多维度布局智能驾驶业务。公司于报告期内上线了第四代智能驾驶标注平台,实现了智能驾驶应用场景全覆盖,可支持包括4D毫米波雷达、激光雷达、鱼眼摄像头等各类传感器的新型数据处理需求。此外,公司通过整合当前主流的神经网络算法架构和海量的自有数据集,进行大量的模型训练和调优,提升了2D视觉及3D点云连续帧标注中的插值、预测、自动贴合、地面检测等算法效果,改善了标注效率和准确率。公司历来重视数据安全能力建设,并在相关资质方面加强布局,于2022年6月取得北京市规划和自然资源委员会行政许可,获得乙级测绘资质,为公司合规开展汽车数据采集、标注业务,建立完整数据解决方案、生产标注化数据集产品,奠定了坚实的基础。
更新时间:2023-06-21 13:38:29
【训练数据相关的应用服务】公司基于自身生产的训练数据提供算法模型相关的训练服务,运用训练数据研发能力助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景的专属算法模型,提高AI技术应用效果。前述产品、服务均以公司生产的专业训练数据集为核心或基础。公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成可供算法模型训练使用的专业数据集。成品训练数据集主要由数据文档、说明文档、技术文档三部分构成。以智能语音训练数据集为例,成品训练数据集包含原始采集形成的音频文件、与音频文件对应的带有时间戳的标注文件,训练数据集相关的设计文档、训练数据集说明,发音词典,数据集参数信息文件等。
更新时间:2023-06-21 13:37:15
【计算机视觉】公司通过设计训练数据集结构、采集(如定义合适的人脸、动作、场景作为采集对象,组织被采集人按照要求拍摄照片、录制视频等)、加工(对图像、视频文件进行打点、拉框、分割标注等)、质检(对数据集进行质量检测,如检验图片、视频文件格式是否正确,检查光照环境、物体种类的数量是否达标,打点标框的准确率是否符合要求等);或者对客户提供的图像、视频文件执行加工、质检工作,最终形成客户所需的计算机视觉训练数据集。
更新时间:2023-06-21 13:36:29
【客户资源】公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、短视频、虚拟人、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。目前公司客户累计数量为810家,覆盖了科技互联网、社交、IoT、智能驾驶、智慧金融等领域的主流企业,教育科研机构以及部分政企机构。
更新时间:2023-06-21 13:32:06
【语音语言学能力】公司持续保持语音语言学研究力度,在语音语言学基础研究方面,公司不断丰富合作语言学家团队资源,成员遍布世界各地的学校及研究机构,在语音语言学领域具备丰富经验和技术储备。此外,公司建立了成熟的发音词典构建流程,截至2022年末,已积累下超过110个语种/方言的发音词典,覆盖希伯来语、乌尔都语、缅甸语、阿姆哈拉语、普什图语、阿尔巴尼亚语、格鲁吉亚语等小语种,累计词条数超过1,000万条,可支撑构建高质量的智能语音、多语种OCR及手写体训练数据。截至报告期末,公司已经拥有近200个语种/方言的覆盖能力,不仅包括含英、法、德、意、西、日、韩等常见外语种,还包括东南亚、一带一路等国家地区的罕见小语种,尤其在亚洲小语种、中东欧小语种的服务上具备竞争优势,同时也是公司的主要壁垒及核心技术之一。
更新时间:2023-06-21 13:31:28