PolarDB结合AI,用SQL玩转多模态混合搜索

无需搬运数据,告别复杂AI工具链,PolarDB创新融合AI引擎,原生SQL轻松实现多模态智能检索,图片+文本混合搜索。

原文标题:SQL玩转多模态AI,轻松搞定图片+文本混合搜索

原文作者:阿里云开发者

冷月清谈:

本文介绍了如何利用阿里云PolarDB数据库,结合SQL和AI能力,实现高效的多模态智能检索。该方案将AI智能引擎与数据库原生集成,通过SQL直接调用多模态AI服务,完成图像特征提取和向量化处理,无需数据迁移,简化了AI应用的开发和部署流程。主要优势包括:低门槛AI集成,通过SQL实现AI全生命周期管理;灵活适配多应用场景,支持自定义搜索维度;全链路数据安全闭环,数据无需流出数据库;按需付费与免运维,采用Serverless模式降低成本。文章还提供了详细的实践部署步骤,指导用户如何基于PolarDB PostgreSQL版和阿里云百炼模型服务,搭建智能多模态搜索应用,并部署到函数计算。

怜星夜思:

1、文章里提到了多模态搜索可以应用于电商、医疗、工业等领域,你觉得在哪个领域会更有潜力?为什么?
2、文章中强调了数据安全的重要性,但“数据库内 AI 计算”真的能完全避免数据泄露风险吗?还有哪些潜在的安全风险需要考虑?
3、文章提到了Serverless架构的按需付费和免运维,听起来很美好。但如果业务量突然暴增,或者模型复杂度很高,这种架构会不会反而更贵?

原文内容

一、引言

在AI驱动智能商业的今天,传统搜索系统已无法满足用户对“秒级响应+多模态交互”的极致体验追求。然而,当前AI检索系统却普遍面临两大难题:数据需要从数据库“搬运”到向量库,造成冗余与版本混乱;工具链割裂,模型调用复杂、部署困难,让AI难以真正融入核心业务。

本文介绍一种破局思路:原生SQL 轻松实现多模态智能检索。基于 PolarDB 创新融合 AI 智能引擎,实现 AI 能力与数据库的原生集成,通过标准 SQL 语法直接调用多模态 AI 服务,高效完成图像特征提取与向量化处理。无需迁移数据、无需搭建独立服务,真正做到“数据库内 AI 计算”。

图片


二、方案优势

低门槛 AI 原生集成

基于标准 SQL 实现 AI 全生命周期管理,无需复杂算法开发,通过 SQL 接口即可调用多模态 AI 能力。大幅降低开发者使用门槛,让团队快速构建智能搜索应用。

灵活适配多应用场景

支持自定义搜索维度,通用多模态向量模型可轻松适配电商、医疗、工业等不同领域的专业检索需求,提供高度定制化的搜索体验。

全链路数据安全闭环

采用“数据库内 AI 计算”架构,原始数据无需流出 PolarDB 即可完成特征提取与模型推理,结合细粒度权限控制以及加密技术,显著降低数据泄露风险。

按需付费与免运维

采用 Serverless 模式,用户只需为实际使用的计算资源付费,显著降低运维成本。开发者无需关心底层计算资源的运维和管理,让企业更加专注于核心业务系统。

三、方案架构

本方案将基于PolarDB PostgreSQL 版,结合阿里云百炼模型服务,构建一个开箱即用的智能多模态搜索应用,实现文搜图、图搜图等场景化需求,并通过 Serverless AI 应用开发平台 Function AI 部署至函数计算。配置完成部署后,会在阿里云上搭建一个如下图所示的运行环境。

借助 Function AI 用户可以快速便捷地部署模型,而无需担心底层资源管理和运维问题,从而专注于应用的创新和开发。同时 Function AI 提供了免运维的高效开发环境,具备弹性伸缩和高可用性,并采用按量付费模式,有效降低资源闲置成本。

四、实践部署

1)部署资源

开通函数计算服务[1],创建1个专有网络VPC和交换机[2]、1 个对象存储OSS Bucket[3]和1 个云数据库 PolarDB PostgreSQL 版集群[4]。

图片

2)部署应用

  • 登录云原生数据库 PolarDB 集群列表[4],将页面上方地域选择为之前创建资源的地域 华北 2(北京)。在列表中单击所创建的集群的 ID,进入集群管理页面参考手册进行参数配置。

  • 访问阿里云百炼控制台[5],选择全部 API-Key 或我的 API-Key进行创建 API Key ,单击查看,获取 API KEY。

  • 前往部署[6]打开我们提供的 Function AI 项目模板,参考手册进行参数配置,其他参数选择默认配置。

3)方案验证

访问示例应用并导入图片数据,进行文本搜索模式和图片搜索模式验证。

图片


五、清理资源

在本方案中,会创建1个百炼 API Key 、1个交换机、1个专有网络VPC、1 个云数据库 PolarDB PostgreSQL 版集群和1 个对象存储OSS Bucket。测试完方案后,您可以点击释放并按照提示完成删除操作。避免继续产生费用。

快点击阅读原文部署体验吧~

参考链接:

[1]函数计算服务: https://fcnext.console.aliyun.com/overview?utm_content=g_1000404364

[2]专有网络VPC和交换机:https://vpcnext.console.aliyun.com/vpc/cn-qingdao/vpcs?utm_content=g_1000404365

[3]对象存储OSS Bucket:https://oss.console.aliyun.com/overview?utm_content=g_1000404366

[4]云数据库 PolarDB PostgreSQL 版集群:https://polardb.console.aliyun.com/overview?utm_content=g_1000404367

[5]阿里云百炼控制台:https://bailian.console.aliyun.com/?utm_content=g_1000404368

[6]前往部署:https://ram.console.aliyun.com/authorize?utm_content=g_1000404369

我觉得要看具体场景。像这种多模态搜索,如果用户搜索频率不高,或者只在特定时间段有高峰,Serverless就很有优势。毕竟不用一直开着服务器,浪费资源。

Serverless是把双刃剑。业务量小的时候确实省钱省心,但并发一高,费用蹭蹭往上涨。而且复杂模型的推理对计算资源要求高,函数计算可能不适合。得做好压力测试和成本评估,别被坑了。