随着AI应用,特别是大型语言模型在各产业的普及,其潜在的安全漏洞已成为企业挥之不去的阴影。深耕AI安全的台湾安全企业奥义智能科技(CyCraft)于日前宣布,将和台湾提供企业自主AI解决方案企业APMIC(Accelerate private machine Intelligence Company)合作,共同推出业界首款专为防御而生的AI模型XecGuard,以及Safety LLM安全评测服务。
奥义智能科技首席技术官暨共同创办人邱铭彰表示,目前已经有多家正在使用AI聊天机器人的企业用户会做先导测试(Pilot Run),预计今年第三季推出网关端的AI防火墙产品XecGuard,便利更多企业使用。
邱铭彰表示,XecGuard是从根本上解决大型语言模型(LLM)面临安全挑战的产品,特别是针对“提示词注入”(Prompt Injection)、提示词窃取(Prompt Extraction)和“越狱”(Jailbreak)等恶意攻击,提供防御能力。
根据邱铭彰的解析,XecGuard不仅是技术的突破,更是AI“安全”(Safety)思维,而非传统“安全”(Security)思维的典范转移,原因在于:攻击者可能通过诱导AI产生不当内容,甚至窃取敏感数据,造成难以估量的损失。
他也指出,传统的安全防护,如基于规则的防火墙(Rule-based Firewall),在面对AI模型复杂的人类输入与逻辑时,往往显得力不从心。正如邱铭彰所言:“你看看那些爷爷奶奶角色扮演,没办法写防火墙规则,也没办法写如何被防火墙全部阻挡,只有魔法才能打败魔法。”
奥义智能的XecGuard正是这“魔法”的体现。邱铭彰解释,它并非传统意义上的防火墙,而是一种革命性的LoRA(Low-Rank Adaptation)安全升级模块。LoRA是在AI领域,特别是语言模型领域相当常见的微调(Fine-tuning)技术,它允许将一个小模块“嫁接”到大型语言模型上,赋予其全新的能力,同时保持基础模型架构的完整性。
邱铭彰进一步阐释:“它其实是一种Model(模型)的技术,可以把一个小的模块装在语言模型(Language Model)上,然后它就具备新的能力”。这项技术的核心优势在于:“即插即用”(Plug-and-Play)的特性,企业无需修改既有的模型架构,也无需额外进行训练或翻译,即可直接安装,如同为LLM穿上强大的防御装甲。
邱铭彰提到,目前业界对于AI防火墙这个“术语”还没有公用的说法。虽然微软推出Azure AI Studio安全工具,Cloudflare也有Firewall for AI等产品提供类似功能,“但它们大多采用规则(Rule-based)检查输入与输出。”他说。
奥义智能推出的XecGuard则是真正基于“模型”的安全模型,他表示,为了更便利企业用户使用,预计今年第三季,奥义智能会将XecGuard这款AI模块硬件化,使其能作为独立的网关(Gateway)产品,可以安装在AI聊天机器人之前,做到自动过滤有害问题与有害内容的AI硬件防火墙。
XecGuard最引人入胜的创新之处,在于其独特的训练方法,使AI模型能够从根本上“学会”遵守规则,而非被动地阻挡已知的违规行为。邱铭彰生动地比喻:“等于是你有一个机器人的驾驶帮你开车,但装上这个模块之后,等于这个机器人的驾驶上过了道安讲习,它上过了一些训练课程,会更遵守交通信号灯”。
他进一步说明,传统的安全产品,特别是基于规则的防火墙,就会像是条列“数百万条交通法规”,然后针对每一条违规行为进行阻挡,本质上是一种“黑名单”的策略。
但是,他表示,人类的输入充满了语言的弹性、逻辑的复杂性及隐含的意义,这些都不是简单的模式匹配或正规表达式所能解决的,像是攻击者就常常会通过角色扮演、场景引导等方式,巧妙地绕过规则限制,促使AI做出一些违背原始设置的行为,这就是所谓的“越狱”。
XecGuard则是通过该公司多阶段微调技术(SFT+GRPO),并运用近六万笔独家安全攻防数据集进行训练。邱铭彰指出,这种训练方式让模型能够自我理解,并“遵守交通规则”,可以更严格地遵循其基础设置(System Prompt)所定义的政策与规范。
邱铭彰表示,它不只是识别“违规”,更是内化了“以人为本,保护人类生命”的核心原则。如同之前举例的那位上过道安讲习的机器人驾驶,它会更遵守原始定义的“交通信号灯规范”,而不容易被用户的奇特提问所影响,做出有害的内容,例如“路上的狗跳出来,在其他道路都乱开车”的不当行为。
邱铭彰强调,奥义智能的XecGuard,从根本增至待的是AI的“Safety”(安全)问题,而不是传统安全的“Security”(资讯安全)问题。“这是个巨大的区别,因为它要求模型从行为的本质上实现可信赖性,而非仅仅是防堵外部威胁。”他认为,这种以语言模型对抗真实攻击,特别是提示词注入的能力,是目前市场上用规则无法解决的难题,也是XecGuard最大的特色。
XecGuard的实力不仅体现在其独特的技术理念,更在严格的实战测验得到验证。奥义智能科技选择了APMIC与Twinkle AI社交媒体联合开发的3B规模开源模型“F1”,搭配XecGuard安全升级模块进行实际攻防演练,并通过业界常见的LLM Red Teaming攻防测试来验证成效。
结果令人印象深刻,整体安全防御分数平均提升了19.4%,在特定攻击场景下,防御效果甚至高达33.9%,展现了卓越的安全韧性。更令人惊讶的是,F1模型结合XecGuard后的防护表现,已显著超越了同级甚至更大规模的商业模型,包括OpenAI等大型商业级模型,以及Llama 3B、Qwen3 4B、Gemma3 4B、DeepSeek 8B等主流开源模型。
邱铭彰认为,根据这些测试结果,不仅证明小参数模型通过安全蒸馏与专属训练,可以做到媲美国际商业大型模型的防护力,也为企业在兼顾成本与性能的前提下,提供了顶级的AI安全保障。
邱铭彰也提到,目前商业模型的分数在他们的基准测试报告中都“蛮惨的”,这更突显了XecGuard面对复杂攻击时的优势。
XecGuard的问世,是奥义智能科技与APMIC战略合作的结晶,其中,APMIC自2017年在台湾创立以来,以其自然语言理解(NLU)核心技术,为企业提供模型代工的“S1模型微调与蒸馏”解决方案、企业私有化AI解决方案“PrivAI”,以及一站式AI Chatbot构建平台“CaiGunn开讲”。目前,APMIC产品已广泛应用于横跨健康、制造、金融、零售等1100多家企业和政府部门。
邱铭彰表示,这一次的“强强联手”,就是结合奥义智能的安全攻防经验与APMIC的AI开发实力。他指出,APMIC不仅是NVIDIA的合作伙伴,未来也计划在他们的推论服务器(inference server)中,默认搭载奥义智能的XecGuard安全模型。“这意味着,企业将能更便捷地将XecGuard集成到其现有的AI基础设施中,大幅降低部署门槛。”他说。
奥义智能科技首席执行官暨共同创办人吴明蔚强调:“过去我们用AI解决安全难题,现在我们用AI保护AI。”他表示,XecGuard融入了该公司在政府、金融等关键领域的实战攻防经验,它不只智能,更有韧性,是企业在AI时代最坚实的防护盾。
AI安全议题的严重性已逐渐浮现,并成为企业关注的焦点。邱铭彰指出,虽然目前AI圈普遍倾向“冲快再说”,但很快就会意识到安全议题的严重性。他指出,奥义智能已接获某些银行首席安全官主动联系,表达试用XecGuard的高度意愿,这也印证市场对此类安全解决方案的迫切需求。
XecGuard的目标客户群,尤其锁定那些提供“对外客服”的聊天机器人应用的企业,邱铭彰指出,这类聊天机器人直接面对广大用户,容易受到来自“网络用户们”各种充满创意且难以预测的攻击。
因此,他表示,诸如电商、高科技产业及金融业等大量采用客服机器人的领域,将是XecGuard最适合的应用场景。“广义而言,任何将AI嵌入自家服务的企业,都非常适合导入XecGuard。”他说。
邱铭彰表示,目前,奥义智能已有一些客户准备进行这款AI防火墙产品XecGuard的先导测试,预计今年第三季正式对外推出网关端的硬件版AI防火墙,便利企业更容易部署。
随着XecGuard的问世,他也说,奥义智能科技与APMIC将引领业界迈向AI必须安全、且安全必须是“标配”而非“选配”的新时代。
富明证券-富明证券官网-网上股票配资开户-理财配资平台提示:文章来自网络,不代表本站观点。