来源 :拓尔思2024-07-18
日前,2024可信数据库发展大会在北京召开,行业内近百位专家学者、企业代表围绕数据库技术、产业和生态热点进行研讨,共同论道人工智能浪潮和数据要素背景下,我国数据库产业高质量发展新路径。
拓尔思应邀参会,发表《TRS海贝数据库在RAG中的应用实践》的主题演讲,入选2024中国数据库产业图谱并通过向量数据库产品基础能力测试。会上,拓尔思首倡并参与编写的《搜索型数据库白皮书》正式发布。
#入选2024中国数据库产业图谱#
《中国数据库产业图谱(2024年)》是由中国通信标准化协会大数据技术标准推进委员会发布的数据库产业全景图,以产品技术、市场份额、知识产权、学术贡献及企业声誉等多维度指标为综合评价标准,旨在全面客观展现我国数据库产业中的关键领域、环节和代表企业。拓尔思凭借自主研发的TRS海贝数据库在搜索型数据库与向量数据库领域取得的成绩成功入选,彰显了其在数据库技术创新与应用实践方面的深厚实力与广泛影响力。
TRS海贝数据库是市场上极少数同时符合搜索数据库标准和向量数据库标准的纯国产自研软件之一。V10.0版本在倒排索引的基础上,引入了高性能的HNSW向量索引,不仅支持常见的文本检索、拼音检索、同义词检索等,还可以搭配大模型(深度学习引擎)实现语义搜索、图片搜索、跨模态搜索以及融合搜索等,可广泛用于企业搜索、检索增强生成以及智能问答等应用场景。
#通过可信数据库产品测试#
在中国信通院可信数据库“向量数据库”产品测试中,拓尔思TRS海贝搜索数据库系统顺利完成向量数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性、兼容性、扩展性、高可用以及工具生态七大能力域的相关要求。测试结果表明,该产品在向量数据库的功能完备性、易用性、通用性等方面均符合标准要求。
《向量数据库技术要求》是中国信通院云计算与大数据研究所联合超过50家企业专家参与编制的技术标准,拓尔思为核心参编单位之一。作为业内首个向量数据库技术标准,可为向量数据库的研发、测试以及选型提供参考。
2023年,海贝搜索数据库通过首批可信数据库“搜索型数据库”产品能力评测。
#参编《搜索型数据库白皮书》#
为进一步加强业内对搜索型数据库在历史沿革、关键技术、应用场景等方面的共识,更深入地推动搜索型数据库规模化应用和持续创新,中国通信标准化协会大数据技术标准推进委员会联合拓尔思、极限科技、星环科技等多家企业专家编制完成《搜索型数据库白皮书》。
白皮书从搜索型数据库的发展历程、核心技术、关键特性、应用场景等多个维度进行介绍,对搜索型数据库的的整体发展现状以及未来演进趋势进行了概括总结,为技术创新、企业决策提供参考。
# TRS海贝数据库在RAG中的应用实践#
在搜索与分析型数据库多模数据库分论坛上,拓尔思产品总监李银松发表《TRS海贝数据库在RAG中的应用实践》的主题演讲,介绍了TRS海贝数据库的发展历史、技术优势以及RAG解决方案。
李银松表示,TRS海贝数据库V10.0是市场上极少数同时符合搜索数据库标准和向量数据库标准的纯国产自研软件之一。其前身为1993年拓尔思成立之初推出的首款全文检索产品——TRS Database Server,该产品于1997年荣获国家科技进步二等奖。
随着大模型时代的到来,信息检索方式从关键词搜索转向问答式搜索,传统搜索型数据库难以适应检索方式的变革。在此背景下,海贝搜索数据库引入向量索引,通过对多模数据的向量化处理,实现跨模态之间的数据转化,并为大模型提供知识补充,弥补大模型在知识更新不及时、幻觉问题、缺乏记忆等方面的短板。
相较于其他同类产品,海贝向量数据库具有四项独特优势:一是利用内存+磁盘解决方案替代纯内存方案,突破“容量天花板”;二是利用分布式向量数据库替代单机版,提升产品可用性;三是数据高机密性+软件自研,为数据安全提供保障;四是全文索引和向量索引融合,提升检索结果可控性。
基于海贝向量数据库、海聚数据融合平台与拓天大模型生成的RAG解决方案具备高性能、融合检索、安全可靠等诸多优势,目前已成功落地应用,帮助某金融机构获取企业风险舆情、某出版社进行历史事件时间校对等。