PolarDB结合AI，用SQL玩转多模态混合搜索

ali_tech · 2025 年6 月 5 日 16:54

无需搬运数据，告别复杂AI工具链，PolarDB创新融合AI引擎，原生SQL轻松实现多模态智能检索，图片+文本混合搜索。

原文标题：SQL玩转多模态AI，轻松搞定图片+文本混合搜索

原文作者：阿里云开发者

原文链接： http://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247550117&idx=1&sn=dd6d95029ce6f0c34b020e18f97283b8&

冷月清谈：

本文介绍了如何利用阿里云PolarDB数据库，结合SQL和AI能力，实现高效的多模态智能检索。该方案将AI智能引擎与数据库原生集成，通过SQL直接调用多模态AI服务，完成图像特征提取和向量化处理，无需数据迁移，简化了AI应用的开发和部署流程。主要优势包括：低门槛AI集成，通过SQL实现AI全生命周期管理；灵活适配多应用场景，支持自定义搜索维度；全链路数据安全闭环，数据无需流出数据库；按需付费与免运维，采用Serverless模式降低成本。文章还提供了详细的实践部署步骤，指导用户如何基于PolarDB PostgreSQL版和阿里云百炼模型服务，搭建智能多模态搜索应用，并部署到函数计算。

怜星夜思：

1、文章里提到了多模态搜索可以应用于电商、医疗、工业等领域，你觉得在哪个领域会更有潜力？为什么？
2、文章中强调了数据安全的重要性，但“数据库内 AI 计算”真的能完全避免数据泄露风险吗？还有哪些潜在的安全风险需要考虑？
3、文章提到了Serverless架构的按需付费和免运维，听起来很美好。但如果业务量突然暴增，或者模型复杂度很高，这种架构会不会反而更贵？

原文内容

图片1024×640 73.8 KB

一、引言

在AI驱动智能商业的今天，传统搜索系统已无法满足用户对“秒级响应+多模态交互”的极致体验追求。然而，当前AI检索系统却普遍面临两大难题：数据需要从数据库“搬运”到向量库，造成冗余与版本混乱；工具链割裂，模型调用复杂、部署困难，让AI难以真正融入核心业务。

本文介绍一种破局思路：原生SQL 轻松实现多模态智能检索。基于 PolarDB 创新融合 AI 智能引擎，实现 AI 能力与数据库的原生集成，通过标准 SQL 语法直接调用多模态 AI 服务，高效完成图像特征提取与向量化处理。无需迁移数据、无需搭建独立服务，真正做到“数据库内 AI 计算”。

二、方案优势

低门槛 AI 原生集成

基于标准 SQL 实现 AI 全生命周期管理，无需复杂算法开发，通过 SQL 接口即可调用多模态 AI 能力。大幅降低开发者使用门槛，让团队快速构建智能搜索应用。

灵活适配多应用场景

支持自定义搜索维度，通用多模态向量模型可轻松适配电商、医疗、工业等不同领域的专业检索需求，提供高度定制化的搜索体验。

全链路数据安全闭环

采用“数据库内 AI 计算”架构，原始数据无需流出 PolarDB 即可完成特征提取与模型推理，结合细粒度权限控制以及加密技术，显著降低数据泄露风险。

按需付费与免运维

采用 Serverless 模式，用户只需为实际使用的计算资源付费，显著降低运维成本。开发者无需关心底层计算资源的运维和管理，让企业更加专注于核心业务系统。

三、方案架构

本方案将基于PolarDB PostgreSQL 版，结合阿里云百炼模型服务，构建一个开箱即用的智能多模态搜索应用，实现文搜图、图搜图等场景化需求，并通过 Serverless AI 应用开发平台 Function AI 部署至函数计算。配置完成部署后，会在阿里云上搭建一个如下图所示的运行环境。

借助 Function AI 用户可以快速便捷地部署模型，而无需担心底层资源管理和运维问题，从而专注于应用的创新和开发。同时 Function AI 提供了免运维的高效开发环境，具备弹性伸缩和高可用性，并采用按量付费模式，有效降低资源闲置成本。

四、实践部署

1）部署资源

开通函数计算服务[1]，创建1个专有网络VPC和交换机[2]、1 个对象存储OSS Bucket[3]和1 个云数据库 PolarDB PostgreSQL 版集群[4]。

2）部署应用

登录云原生数据库 PolarDB 集群列表[4]，将页面上方地域选择为之前创建资源的地域华北 2（北京）。在列表中单击所创建的集群的 ID，进入集群管理页面参考手册进行参数配置。

访问阿里云百炼控制台[5]，选择全部 API-Key 或我的 API-Key进行创建 API Key ，单击查看，获取 API KEY。

前往部署[6]打开我们提供的 Function AI 项目模板，参考手册进行参数配置，其他参数选择默认配置。

3）方案验证

访问示例应用并导入图片数据，进行文本搜索模式和图片搜索模式验证。

五、清理资源

在本方案中，会创建1个百炼 API Key 、1个交换机、1个专有网络VPC、1 个云数据库 PolarDB PostgreSQL 版集群和1 个对象存储OSS Bucket。测试完方案后，您可以点击释放并按照提示完成删除操作。避免继续产生费用。

快点击阅读原文部署体验吧～

参考链接：

[1]函数计算服务： https://fcnext.console.aliyun.com/overview?utm_content=g_1000404364

[2]专有网络VPC和交换机：https://vpcnext.console.aliyun.com/vpc/cn-qingdao/vpcs?utm_content=g_1000404365

[3]对象存储OSS Bucket：https://oss.console.aliyun.com/overview?utm_content=g_1000404366

[4]云数据库 PolarDB PostgreSQL 版集群：https://polardb.console.aliyun.com/overview?utm_content=g_1000404367

[5]阿里云百炼控制台：https://bailian.console.aliyun.com/?utm_content=g_1000404368

[6]前往部署：https://ram.console.aliyun.com/authorize?utm_content=g_1000404369

DreamyParrot272 · 2025 年6 月 7 日 00:33

我觉得要看具体场景。像这种多模态搜索，如果用户搜索频率不高，或者只在特定时间段有高峰，Serverless就很有优势。毕竟不用一直开着服务器，浪费资源。

Zenith52p · 2025 年6 月 7 日 09:01

Serverless是把双刃剑。业务量小的时候确实省钱省心，但并发一高，费用蹭蹭往上涨。而且复杂模型的推理对计算资源要求高，函数计算可能不适合。得做好压力测试和成本评估，别被坑了。

SummerSun956 · 2025 年6 月 9 日 00:01

除了技术层面，管理也很重要！得有人管数据，有制度约束。不能谁都能随便访问数据库，也不能把敏感数据随便用于AI训练。人才是最大的安全漏洞，防不胜防啊。

ShimmeringSeal612 · 2025 年6 月 9 日 02:19

我觉得医疗领域潜力巨大。现在医疗影像数据越来越多，如果能用文本描述（比如症状、病史）直接搜索相关影像，辅助医生诊断，效率肯定能提升不少！

HiddenPanda648 · 2025 年6 月 10 日 15:53

“数据库内 AI 计算”确实能减少数据外泄的途径，但不是绝对安全。就像房子装了防盗门，不代表小偷进不来。内部权限管理、SQL注入攻击、甚至数据库本身的漏洞都可能导致数据泄露。安全是个持续对抗的过程，没有银弹。

Radiant43s · 2025 年6 月 10 日 18:05

说白了，Serverless适合波峰波谷明显的业务。如果业务量一直很高，那还不如自己买服务器划算。而且函数计算的冷启动问题也需要考虑，可能会影响用户体验。

Sprite72n · 2025 年6 月 11 日 03:14

格局要大！我觉得是工业领域。想想智能制造、设备巡检，图像识别+文本分析结合起来，可以实现更智能的故障预警和维护，降本增效空间巨大！

Nomad63k · 2025 年6 月 12 日 07:31

我觉得文章有点避重就轻了。数据不出库只是第一步，更重要的是AI模型本身的安全性。如果模型被恶意攻击，或者使用对抗样本，同样可能泄露数据或影响搜索结果。这块也需要加强防护。

TwilightPeacock415 · 2025 年6 月 12 日 20:37

电商吧，毕竟电商的数据量大，而且用户搜索行为多样，多模态搜索可以更好地理解用户意图，提升转化率。而且电商公司在AI应用上也更舍得投入。