向量数据库技术的兴起,正逐步改变大模型训练和推理的格局。在2023年大模型技术的迅猛发展中,向量检索技术,特别是RAG(检索增强生成)技术,成为了数据库技术的焦点。然而,随着RAG技术的广泛应用,其局限性也日益凸显:只能对知识本身进行向量化处理,难以理解和处理独立信息间的链接、关系和语境,因此在处理需要深层次语义关系和上下文细微差别的复杂查询时显得力不从心。
面对这一困境,杭州悦数科技有限公司(以下简称悦数)的CTO叶小萌带领团队,于2023年与LlamaIndex联合提出了Graph RAG的概念,并分享了该概念的初步验证。Graph RAG通过结合图数据库的优势,利用知识图谱能够更精确、全面地检索相关信息,使模型能够关联上下文给出答复。尽管起初在国内反响平平,但悦数团队持续推动这一概念的落地,并于去年11月推出了悦数RAG产品,实现了基于图的检索增强生成,助力企业解决知识孤岛问题。
悦数CTO叶小萌在接受采访时表示,悦数在技术创新上一直走在行业前列。他提到,大模型的兴起带动了RAG技术的发展,但RAG技术存在局限性,即只能处理向量化后的知识,无法展现知识间的关联。而图数据库在处理关联关系上具有天然优势,因此Graph RAG概念的提出,旨在将图数据库与向量技术相结合,弥补RAG技术的不足。
叶小萌介绍,悦数团队在2023年8月首次提出Graph RAG概念时,人们对这一结合还难以想象。但悦数并未因此退缩,而是迅速组建团队开始打造RAG产品。经过一年的努力,悦数RAG产品已经进入PMF阶段,预计今年能够进行推广。在这个过程中,团队克服了许多挑战,特别是在产品初期,负责RAG技术的团队只有古思为一个人。
古思为回顾了Graph RAG的研发过程,他表示,Graph RAG就像一个小帐篷,能够容纳很多东西,但同时也带来了许多抉择的挑战。在没有足够参考的情况下,每个决定都需要反复斟酌。最终,悦数团队取舍简化后呈现的初步验证反响不错,而当时定下来的实现方式,现在依然是Graph RAG的默认常用方法。
除了技术创新,悦数还在国际标准制定方面取得了显著成果。2024年4月,国际标准化组织(ISO)发布了国际标准图查询语言GQL,这是ISO在四十多年里制定的第二个数据库查询语言国际标准。悦数一直跟踪投入这一标准的研发,并在GQL标准发布后的同年11月,推出了全球第一款原生支持GQL的分布式图数据库产品——悦数图数据库v5.0。
在信创领域,悦数也在积极布局。叶小萌表示,悦数不是为了做信创而做信创,这是一个自然发生的过程。悦数图数据库的每一行代码都是团队亲手写下,拥有IP和代码的自主权,为做信创提供了良好的土壤。尽管目前图数据库还未被收录在信创名录中,但悦数已经在适配各种信创操作系统或硬件方面做了大量工作,等待信创市场的东风。
悦数在数据库市场的竞争中,也展现出了强大的实力。叶小萌形容数据库市场的竞争有如跑八百米,进程近半,已经能够分出第一梯队和第二梯队。悦数凭借强大的技术实力和创新能力,成为了市场上的佼佼者。他相信,随着市场的淘汰和筛选,最后能够留下的玩家,将是技术产品最好的。
作为从业者,叶小萌还提到了市场教育的成效。他表示,现在团队接触客户时,已经不再需要介绍图数据库的定义和功能,而是能够直接从介绍行业经验和使用场景开始。这显示了图数据库市场教育已经取得了显著成效,也为悦数等图数据库厂商提供了更多的市场机遇。
微信携手DeepSeek-R1,这家数据中心服务商能否乘AI东风起飞?
苹果造车项目被曝搁浅后再整大活,无需真实数据就能训练自动驾驶
阿里云DataWorks牵手DeepSeek,智能大数据开发治理再升级!
消息称英国要求苹果公司创建“后门” 以便访问用户云端数据
机主逝世后 iPad 自动销毁数据产品“In Case of Death Case”正式发售,1500 美元
快手旗下公司长春新设科技公司,业务涵盖互联网数据服务与农产品销售
年货外卖热!美团数据揭示消费者足不出户购年货新风尚
安卓首家!三星Galaxy S25系列可提供详尽电池健康数据
中联数据:奔跑中的算力巨头如何再添发展新动力?
合成数据:AI模型的未来“养分”还是“陷阱”?
湘ICP备19005331号-4copyright?2018-2025
guofenkong.com 版权所有
果粉控是专业苹果设备信息查询平台
提供最新的IOS系统固件下载
相关APP应用及游戏下载,绿色无毒,下载速度快。
联系邮箱:guofenkong@163.com