基于 DeepSeek 和低代码平台打造专属知识空间

利用 DeepSeek 和低代码平台,快速搭建智能知识库,实现高效知识管理和个性化问答。

原文标题:满血上阵!DeepSeek x 低代码创造专属知识空间

原文作者:阿里云开发者

冷月清谈:

本文介绍了如何结合阿里云百炼和低代码平台魔笔,快速构建一个基于 DeepSeek R1 模型的专属知识空间。该空间利用 Retrieval-Augmented Generation (RAG) 技术,支持知识检索、推理和问答等功能,并提供实时互联网搜索,扩展知识库范围。

用户可以通过两种模式(标准回答/深度思考)与智能体进行多轮对话,并收藏对话记录。知识空间支持创建多个知识专栏,每个专栏拥有独立的知识库和对话记录。用户可以上传和管理文档,构建个性化知识库。

该方案利用百炼的模型即服务 (MaaS) 能力和魔笔的可视化配置,简化了开发流程,同时提供了高度客制化的灵活性。用户可以根据自身需求定制应用内容,并通过简单的操作发布到测试或生产环境。未来,该方案还可以扩展多租户隔离功能,实现更精细的用户权限管理和数据安全保障。

怜星夜思:

1、除了 DeepSeek R1,还有哪些其他的大型语言模型适合构建个人知识库?它们各自的优缺点是什么?
2、低代码平台对于构建这种应用有什么优势?如果不用低代码平台,开发难度会增加多少?
3、如何保证个人知识库的数据安全和隐私?

原文内容

背景

在当今信息爆炸的时代,知识管理与应用已成为个人和组织发展的关键。面对海量且快速更新的信息,如何高效地提取、整合并灵活运用知识,成为我们必须解决的核心问题。想象一下,拥有一个智能化的专属知识库,它不仅能存储您的专业信息和洞见,还能通过先进的人工智能技术为您提供最精准的答案和见解,这将极大地提升您的工作效率和决策能力。
随着 DeepSeek R1 等先进推理模型的出现,人工智能技术在知识管理领域掀起了一场革命性的变革。DeepSeek R1 作为一款卓越的推理型大型语言模型(LLM),展现了令人瞩目的能力:它不仅能够理解复杂的语境,还能进行深度的知识推理,为智能化知识库的构建提供了前所未有的技术支持。这一模型的问世,标志着我们在信息检索、知识整合和智能问答等方面进入了一个全新的阶段。DeepSeek R1 的强大性能,为我们重新定义了知识管理的可能性,使得构建真正智能、高效的知识系统成为现实。在这个信息爆炸的时代,DeepSeek R1 的应用无疑将极大地提升我们处理、理解和利用知识的能力,为个人和组织的发展带来巨大的机遇。
然而,要真正将这些前沿技术落地应用,仍然面临着不小的挑战。如何将海量的非结构化数据有效地组织起来?如何保证知识库的实时更新与准确性?如何让非技术人员也能轻松地构建和使用这样的系统?这些都是我们需要解决的问题。
幸运的是,随着云计算和低代码开发平台的日益成熟,我们现在拥有了更加简便、高效的解决方案。本教程将为您详细展示如何巧妙地结合阿里云百炼的强大功能和多端低代码开发平台魔笔的灵活性,快速构建一个开箱即用、可自由定制的专属知识空间。

图片

通过这个实践指南,您将掌握以下关键技能:
  1. 充分利用阿里云百炼提供的模型即服务(MaaS)能力,快速构造出一个基于满血版 DeepSeek R1 模型的 RAG(Retrieval-Augmented Generation,检索增强生成) 智能体应用。
  2. 熟练运用多端低代码开发平台魔笔,从预制的应用模板出发,迅速启动并开发一个可高度客制化的知识空间应用。
  3. 充分发挥魔笔平台的强大集成能力,无缝对接阿里云百炼服务。通过魔笔的可视化配置和丰富资源连接器,您可以轻松整合百炼的 AI 能力到您的应用中,实现端到端级别的知识推理和知识库内容的动态管理。
魔笔 X 百炼的深度集成不仅简化了开发流程,还大大提升了应用的智能化水平,使您能够在极短时间内打造出一个功能全面、性能卓越的知识管理系统。
无论您是企业管理者、研究人员,还是对知识管理感兴趣的个人,本教程都将为您提供宝贵的实践指导,帮助您在这个信息爆炸的时代更好地驾驭知识,提升效率和创新能力。让我们一起开始这段构建未来知识管理系统的旅程吧!

功能概览

通过本教程构建的专属知识空间,可轻松实现以下功能:

图片

为了支持上述功能,魔笔专属知识空间应用包含以下5个页面:

  1. 知识空间主页:切换不同模式(标准回答/深度思考),选择知识专栏进行提问,之后的对话使用的知识库会以该专栏的知识库作为来源,收藏的对话会进入该专栏。
  2. 回答页:该页面展示个人私教智能体回答的内容,如果选择了深度思考模式,会先输出思考内容,然后输出回复内容,如果是标准回答则直接输出回复内容。该页面可以与智能体进行多轮对话,深入探讨内容。每次对话会输出从该专栏的知识库中检索到的文档片段,支持点击下载源文件。点击对话的星星符号收藏该次对话到专栏中,方便下次溯源该对话。
  3. 知识专栏页:该页面展示所有的知识专栏和概要信息,每个专栏的概要信息包括该专栏中的知识库文档数量和收藏的对话数量。支持新建知识专栏和删除已有的知识专栏。点击知识专栏跳转到该专栏的详情页面。
  4. 专栏详情页:该页面展示特定专栏包含的知识库以及该专栏收藏的所有对话。支持在该页面中直接进行提问,与在知识空间主页进行提问效果一样。支持在该页面中点击收藏的对话跳转到对话页,溯源之前的对话记录,继续提问深入话题。
  5. 知识库详情页:该页面负责管理个人的知识库,展示当前知识库中的所有文档,支持上传文档和删除知识库中已有的文档。

图片


图片

功能架构

本文所涉及的应用及功能架构如下图表所示:

图片

图片

实践教程


构建百炼智能体应用

接下来,我们来从魔笔和百炼平台快速生成一个可深度客制化的个人知识私教应用。首先我们进行 RAG 大模型应用创建。首先我们登录百炼控制台[1],在“我的应用”中选择“新增应用”创建一个 RAG 应用:

图片

为了更好地进行知识型推理,我们在百炼应用的配置界面中选择 “DeepSeek-R1” 作为应用的基础模型:

图片

为了得到更好的知识溯源体验,我们添加知识库并将检索配置中的展示回答来源开启:

图片

图片

为了让我们的百炼应用获取互联网中的更多知识,我们开启百炼应用的实时互联网搜索功能,让联网搜索和个人知识库相结合,使对话更智能:

图片

在简单体验/调试功能后,我们选择将百炼应用进行发布:

图片

同样的操作路径,我们选择通义千问系列、或 DeepSeek V3 模型作为基底模型来构建一个用于快速回答、问题推荐的百炼应用:

图片


资源配置参数获取

接下来,我们来获取构建端到端应用的必要资源配置参数,我们依赖的配置信息主要如下:

图片

获取百炼 API-KEY 、百炼应用 ID、百炼空间 ID

首先,我们分别在“发布渠道”和“应用列表”中,我们获取百炼平台的 API-KEY 、我们发布应用的 APPID 以及百炼业务空间 ID,以便后续创建魔笔应用使用:

图片

图片

图片

获取阿里云 AK/SK

访问密钥 AccessKey(简称AK)是阿里云提供给用户的永久访问凭据,一组由AccessKey ID和AccessKey Secret组成的密钥对,我们可以通过 AK/SK 体系便捷访问阿里云产品[2]暴露的 OpenAPI 进行业务构建。我们后续将在构建的端到端应用中通过 OpenAPI 对百炼控制台的知识库进行管控。关于如何创建主账号 / RAM 账号的 AK/SK ,可以参考创建 AccessKey[3]一文。


创建魔笔应用

接下来,我们基于上一部创建的百炼智能体应用在魔笔平台进行端到端 Web 应用的快速构建。首先,我们进入魔笔的应用控制台,在模板市场中选择个人知识库 - 知识私教模板[4],选择“选用此模板”

图片

输入完应用名称后,我们将上两个小节中获取的 API-KEY 、应用 ID、AK/SK 填入基本信息中并确定创建:

图片

图片

进入应用后,我们还需要将百炼的空间 ID 填入应用内维护的全局变量中:

图片


内容客制化

在完成上一部必要的初始化操作后,我们可以对应用进行内容客制化修改或测试,如我们可以将首页显示的标题改为“论文写作智能私教”:

图片


发布应用

在发布应用之前,我们需要在魔笔控制台的权限管理[5]处设置匿名访问权限允许的范围:

图片

图片

图片

在一切准备就绪后,我们可以发布应用到测试环境了。我们点击魔笔设计器中的发布按钮并填写必要的发布信息:

图片

在发布成功后,我们点击访问应用链接就可以体验我们实际的应用效果了:

图片

未来扩展

  • 域名准备 & 生产环境发布 

在应用开发完成后,我们可以考虑将应用正式发布到生产环境[6],并为其准备一个已完成备案的域名来供其他人访问。域名备案可参考相关文档[7]。

  • 多租户隔离业务扩展

在完成基础框架搭建后,我们可以进一步优化系统,将其改造为支持多用户问答及知识库隔离的形式,以提供更加稳定和个性化的用户体验。这一升级不仅能满足不同用户的独特需求,还能确保数据的安全性和隐私保护。借助魔笔平台提供的强大功能,我们可以轻松实现这一目标:

  1. 用户身份管理:利用魔笔用户中心的身份认证系统,我们可以实现精确的用户识别和权限控制。这为每个用户提供了独立的操作环境,确保数据的隔离和安全。

  2. 数据持久化:通过魔笔内置的数据库功能,我们能够为每个用户创建专属的数据存储空间。这不仅保证了数据的长期保存,也为后续的数据分析和个性化服务奠定了基础。

  3. 个性化问答体验:基于隔离的知识库和用户数据,我们可以为每个用户提供量身定制的问答服务(如借助百炼长期记忆体),提高回答的准确性和相关性。

通过这些优化,我们能够构建一个更加健壮、安全且个性化的多用户问答系统。这不仅提升了用户体验,也为未来的功能扩展和商业化应用打下了坚实的基础。

  • 终端用户接入与身份源

随着业务规模的扩张,我们将面临多元化的用户身份认证需求,这源于不同的发布渠道和应用场景。为应对这一挑战,魔笔用户中心提供了强大而灵活的身份源统一管理功能。这不仅仅局限于本文示例中使用的匿名登录方式,还可以轻松扩展到多种高频使用的终端用户访问方式。通过魔笔平台的身份源管理和登录配置功能,我们能够轻松实现以下多样化的身份认证方案:

  1. 云服务集成:支持阿里云账号登录,为使用阿里云生态的用户提供无缝衔接的体验。

  2. 内部测试支持:提供测试账号分享功能,方便开发团队和质量保证团队进行系统测试和验证。

  3. 企业协作工具整合:

    • 支持钉钉企业应用免登,为已在使用钉钉的企业用户提供便捷的访问渠道。

    • 集成企业微信,满足依赖微信生态的企业用户需求。

  4. 定制化解决方案:支持企业自定义 iDaaS(身份即服务)身份源登录,为有特殊安全需求或已有身份认证系统的企业提供灵活的对接方案。

这种多元化的身份认证策略不仅提高了系统的适应性和兼容性,还能满足不同规模、不同行业企业的多样化需求。通过整合各种主流的身份认证方式,我们的系统可以为用户提供更加便捷、安全且个性化的访问体验,同时也为企业/个人降低了身份管理的复杂性和成本。

参考链接:

[1]https://bailian.console.aliyun.com/#/model-market
[2]https://help.aliyun.com/zh/ram/use-cases/best-practices-for-using-access-credentials-to-access-alibaba-cloud-openapi
[3]https://help.aliyun.com/zh/ram/user-guide/create-an-accesskey-pair
[4]https://mobinext.console.aliyun.com/172353490189822/templates/e8d53055-5e2e-42a0-b708-01ffffcf686c
[5]https://mobinext.console.aliyun.com/172899130666656/authorization/permission
[6]https://help.aliyun.com/zh/mobi/environment-and-domain
[7]https://help.aliyun.com/zh/mobi/how-to-obtain-the-domain-name-icp-filing-service-code

从技术角度来说,可以采用多重加密机制,比如数据传输加密和存储加密。还可以定期进行安全审计,及时发现和修复潜在的安全漏洞。另外,用户也要提高安全意识,不要轻易泄露个人信息。

从学术角度来看,选择 LLM 构建知识库需要考虑以下几个因素:模型的知识储备、推理能力、可解释性以及计算资源需求。DeepSeek R1 在推理方面表现突出,但其他模型,例如 Jurassic-1 Jumbo,在知识覆盖面上可能更广。最终的选择取决于你的应用场景和优先级。

我觉得低代码平台降低了开发门槛,即使不是专业的程序员也能快速上手。如果没有低代码平台,你需要精通前端、后端、数据库等各种技术,还得处理各种复杂的配置,工作量巨大。

数据安全和隐私确实很重要!选择一个靠谱的平台是关键,要看平台有没有安全认证,数据加密措施怎么样。另外,自己也要做好数据备份,多一层保障总是好的。

哈哈,这个问题让我想起了选择手机,每个型号都有自己的卖点。个人觉得,除了 DeepSeek R1,还可以考虑一些开源的 LLM,比如 LLaMA,这样可以根据自己的需求进行微调,灵活性更高。不过,开源模型通常需要更多的技术投入,维护成本也比较高。

这个问题问得好!除了 DeepSeek R1,还有不少其他的大型语言模型(LLM)可以用来构建个人知识库,比如 GPT 系列、BERT 系列等等。选择哪个模型,主要取决于你的具体需求和资源情况。DeepSeek R1 的优势在于推理能力强,尤其适合处理复杂的知识体系。但其他模型也有各自的特色,比如 GPT-3 更擅长生成流畅的文本,BERT 则在语义理解方面表现出色。需要根据实际情况进行权衡。

用低代码平台最大的好处就是快!像搭积木一样,拖拽几个组件就能搞定一个功能,大大缩短了开发周期。如果不用低代码平台,估计得写一堆代码,调试起来也费劲,开发难度可不是增加一点点。

引用一下问题“低代码平台对于构建这种应用有什么优势?如果不用低代码平台,开发难度会增加多少?”,我认为低代码平台的优势在于其可视化开发环境和预置组件,可以快速构建原型并进行迭代。如果不用低代码平台,开发难度会显著增加,需要手动编写大量的代码,并且需要更多的时间和人力成本进行测试和维护。

关于“如何保证个人知识库的数据安全和隐私?”这个问题,可以使用端到端加密技术,确保只有你自己才能访问数据。还可以设置访问权限,控制谁能查看你的知识库。