来源 :电子工程专辑2023-08-21
随着移动高清业务的推广及三方应用的增加,传统按键的方式已经不能满足用户的便捷使用需求了。用户在用遥控器进行内容多维检索、康养知识问答、菜谱制作等服务时,迫切需要自然对话的方式实现与各应用方的互动及检索。本文结合实际应用情况,提供统一的“插件”(APP)化的对话交互方案,降低意图理解、语音识别、设备接入、应用接入的多端成本,提供更自然、更便捷的智能交互服务。
【摘要】
随着移动高清业务的推广及三方应用的增加,传统按键的方式已经不能满足用户的便捷使用需求了。用户在用遥控器进行内容多维检索、康养知识问答、菜谱制作等服务时,迫切需要自然对话的方式实现与各应用方的互动及检索。本文结合实际应用情况,提供统一的“插件”(APP)化的对话交互方案,降低意图理解、语音识别、设备接入、应用接入的多端成本,提供更自然、更便捷的智能交互服务。
【正文】
智能终端如安装支持语音交互的三方应用,需要单独针对这款应用进行语义理解模型构建,根据模型构建需要还要对交互意图进行数据清洗及模型训练,语音服务集成成本非常高,对三方语音交互应用的运营拓展不友好。
面对能力集成复杂、模型训练流程长的问题,中国移动智慧家庭运营中心(以下简称智家中心)探索家庭大模型技术,包括基于deepspeed等方法的超大模型分布式训练技术、基于instruct tuning的家庭行业大模型微调技术、基于人类反馈回报模型和强化学习的大模型强化学习技术,构建更懂专业领域知识、更理解用户操作指令、更能做好陪伴式对话的语音助手,实现更自然、更精准、更智能的用户交互体验。升级后的家庭大模型服务平台将针对端能力APP应用提供模型接入服务,通过模型微调、场景化提示工程等方式引导大模型输出用户需要的交互反馈。
面对家庭智能终端交互服务匮乏、理解能力弱的问题,智家中心完成了基于家庭业务数据的微调大模型构建,具备音乐、视频、智能家居等领域语义理解能力,并探索了3种基于规则的大模型结果融合方案,为实现大模型与原有自然语言理解系统的完美结合奠定基础。
智家中心通过大模型提示工程的方式,打造应用专区prompt工程化运营组件,包括底量视频、布局、实例,可向大中小屏批量生产AI应用,目前已构建故事共创、诗词智创、菜谱生成、口语练习等10+场景的自然互动应用。并经过对不同应用提示工程的优化探索,实现基于文本情绪的差异化文本生成,已在小佳陪聊、AI知己应用上线,实现对话内容质量提升。
依托互动生成服务平台打造的生活云管家产品,目前已在安徽、新疆等6省落地推广,累计发展用户超50万。后续将逐步构建教育、康养、IOT、生活服务等家庭全场景应用的赋能,实现故事共创、口语练习等大模型应用的批量生产。
大模型是AI方向的必然趋势,智家中心会将大模型纳入业务发展规划,利用提示工程进行降本增效、产品革新。并将大模型与家庭行业、运营商特色业务相结合,沉淀更多行业经验,打造家庭领域互动生成服务新体验。