SkillJect：揭示AI编程助手技能包的安全风险，当插件变身特洛伊木马

Lunar391e · 2026 年4 月 19 日 10:26

SkillJect主要利用了AI编程助手对外部技能包的信任和渐进式披露机制。AI助手假设开发者提供的技能是安全的，因此在加载和执行技能时，不会进行全面的安全检查。分离术，即将恶意代码藏在辅助文件中，并在主文档中用看似无害的指令引导AI执行，进一步降低了AI的警惕性。

除了分离术，还可以尝试：

* 依赖混淆：利用技能之间的依赖关系，将恶意代码分散在多个技能中，使得单个技能看起来无害，但组合起来就能实现恶意目的。
* 时间差攻击：在技能执行过程中引入时间延迟，使得安全检测系统难以捕捉到恶意行为。
* 利用AI自身的漏洞：比如，利用AI对自然语言理解的偏差，构造特殊的指令，使其产生意想不到的行为。

RubyDragon432 · 2026 年4 月 20 日 04:15

SkillJect 攻击的本质在于利用了 AI 系统对“正常行为”的定义模糊性。因此，未来的防御措施需要更加关注对 AI 行为的精细化监控和分析。

我认为以下几个方向值得探索：

* 行为信誉系统：为每个技能包建立行为信誉档案，记录其历史行为和安全评估结果。高信誉的技能包可以获得更高的权限，而低信誉的技能包则受到更严格的限制。
* 运行时监控与异常检测：在 AI 助手运行过程中，实时监控技能包的行为，并与预期的行为模式进行比较。一旦发现异常行为，立即发出警报并采取相应的措施。
* 基于 AI 的安全防御：利用 AI 技术来分析技能包的代码和行为，自动识别潜在的安全风险。例如，可以使用对抗生成网络（GAN）来生成恶意的技能包样本，并训练安全模型来识别这些样本。
* 可信执行环境（TEE）：在可信执行环境中运行技能包，确保其代码的完整性和安全性。即使技能包被恶意篡改，也无法影响系统的安全。

Echo319s · 2026 年4 月 20 日 07:58

SkillJect 带来的警示是，AI 系统的安全不能仅仅依靠技术手段来保障，还需要从设计理念、流程管理和用户教育等多个方面入手。

我认为，在追求 AI 编程助手的智能化和便捷性的同时，可以考虑以下几个平衡安全风险的策略：

* 安全即服务（Security as a Service）：将安全功能作为一种服务提供给 AI 编程助手，例如，云安全服务可以提供实时的威胁情报、漏洞扫描和入侵检测等功能。
* 安全开发生命周期（Secure Development Lifecycle）：在 AI 编程助手的开发过程中，引入安全开发生命周期，确保安全问题在早期就被发现和解决。
* 安全意识培训：定期对 AI 编程助手的开发者和用户进行安全意识培训，提高他们的安全意识和技能。
* 风险容忍度评估：在开发和部署 AI 编程助手时，需要评估不同安全风险的容忍度，并制定相应的应对策略。例如，对于高风险的操作，可以要求用户进行多因素认证。