使用MongoDB构建AI:Jina AI将突破性开源嵌入模型变为现实
Jina AI推出首个开源8K文本嵌入模型,显著提高数据索引和搜索能力,其嵌入模型与MongoDB关键技术的无缝集成,助力开发者高效构建AI驱动应用。
Jina AI创立于2020年,总部位于德国柏林,主要从事提示工程和嵌入模型业务,已迅速成长为多模态AI领导者。Jina AI积极推动开源和开放研究,致力于弥合先进AI理论与开发者及数据科学家构建的AI驱动型真实世界应用程序之间的差距。目前,Jina AI平台已拥有超过40万名注册用户。
Jina AI创始人兼CEO肖涵博士在阐述公司使命时表示:“我们希望能够为多模态AI未来的实现铺平道路。我们发现当前的机器学习和软件生态系统在处理多模态AI方面面临着一些挑战。 鉴于此,我们鼎力研发开创性工具和平台,助力企业和开发者解决这些复杂问题。我们的愿景是发挥自身的关键作用,帮助全球用户充分利用多模态AI的巨大潜力并彻底改变信息的解读和互动方式。”
Jina AI在嵌入模型领域的研究引起了业界的广泛兴趣和关注。因为如今许多开发者都已认识到嵌入技术对于生成式AI的重要意义。嵌入模型是非常复杂的算法,可以将任意结构的数据转化并嵌入到多维数字编码(即向量)中。这些向量通过捕捉数据的模式和关系来赋予数据相应的语义信息。 这意味着,我们可以使用与结构化业务数据相同的方式来分析和搜索非结构化数据。考虑到我们每天生成的数据中有80%以上是非结构化数据,我们开始对嵌入模型与MongoDB Atlas Vector Search 等先进解决方案相结合对生成式AI带来的变革性影响充满期待。
Jina AI推出的jina-embeddings-v2是目前首个开源8K文本嵌入模型。该模型的标记长度达到8K,这使其能够更深入地理解上下文,从而显著提高检索增强生成(RAG)和语义搜索等任务的准确性和相关性。Jina AI的嵌入模型具有增强型数据索引和搜索能力,并支持双语环境。 嵌入模型专注于单一语言和语言对,确保在特定语言基准测试中达到最先进的性能。Jina Embeddings v2目前已经发布了德语-英语和汉语-英语的双语模型,其他双语模型正在开发中。
Jina AI的嵌入模型在分类、重排、检索和摘要等方面均有优异表现,因此适用于各种应用场景,尤其是跨语言任务。 近期,该嵌入模型在跨国企业客户中的部分应用案例包括:销售序列自动化、人力资源技能匹配以及附带欺诈检测功能的付款对账等。
肖涵博士表示:“我们的嵌入API能够原生集成生成式AI开发者堆栈中的关键技术,包括MongoDB Atlas、LangChain、LlamaIndex、Dify和Haystack。MongoDB Atlas将应用程序数据和向量嵌入整合至一个统一的平台,使两者之间完全保持同步。每当数据库中加入新的数据或更新已有数据时,Atlas Triggers都会调用嵌入API,以确保嵌入始终保持最新状态。 这种集成式方法使开发者能够更加高效地为企业构建全新的前沿AI驱动型应用程序。”
如需开始使用MongoDB和Jina AI,请注册MongoDB Atlas并阅读操作指南。如果您的团队正在构建AI应用程序,欢迎报名参加AI创新者计划。报名成功的公司可以获得免费的Atlas学分和技术扶持,并与更广泛的AI生态系统建立联系。
MongoDB Atlas
MongoDB Atlas 是 MongoDB 公司提供的 MongoDB 云服务,由 MongoDB 数据库的开发团队构建和运维,可以在亚马逊云科技、Microsoft Azure、Google Cloud Platform 云平台上轻松部署、运营和扩展。MongoDB Atlas 内建了 MongoDB 安全和运维最佳实践,可自动完成基础设施的部署、数据库的构建、高可用部署、数据的全球分发、备份等即费时又需要大量经验运维工作。让您通过简单的界面和 API 就 可以完成这些工作,由此您可以将更多宝贵的时间花在构建您的应用上。
我们将持续更新「使用MongoDB构建AI」客户案例系列,欢迎持续关注MongoDB官方号查看更多精彩内容!
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)