入选理由:标准化数据集产品,是公司区别于众多竞争对手以定制化服务为主的特有商业模式,也是公司核心竞争力之一。截止2025年6月末,公司新增研发超70个训练数据集产品,自有知识产权的训练数据产品储备达到1,790个,尤其在多语种语音对话、多语种OCR、多音色多情感数据集等方面积累了更丰富的标准化产品资源,并建成包括“双工数据集”、“视觉大模型(图像-文本)预训练及微调数据集”等在内的多领域大模型数据集。公司已向下游客户提供了累计超过10,000次/个定制或标准化训练数据集,并已应用于个人助手、语音输入、内容生成、智能家居、机器人、语音导航、智能客服、智能播报、语音翻译、移动社交、虚拟人、智能驾驶、智慧医疗、智慧教育、智慧交通、智慧城市、智慧金融、机器翻译、智能问答、信息提取、情感分析、OCR识别等22类创新应用领域,赋能人工智能技术与实体经济的深度融合。