从ADC到ADSP,F5重构AI时代应用交付与安全体系
过去两年,AI产业经历了从模型竞赛到应用落地的快速演进。随着推理需求激增、智能体兴起以及企业级AI部署规模扩大,一个新的问题开始浮出水面:当每天数百万亿Token在全球网络中流转,谁来保证这些Token能够被安全、高效且经济地生产、调度与交付?
在F5 Solution Day 2026媒体发布会上,F5北亚区总裁黄彦文、F5亚太区首席技术官Mohan Veloo、F5北亚区区域副总裁产及解决方案资深架构咨询师张振伦,以及F5中国区产品及解决方案总经理陈亮,共同描绘了一幅AI时代基础设施的新图景。
在他们看来,AI时代真正的竞争,不再只是模型能力的竞争,而是围绕Token展开的新一轮基础设施竞争。作为应用交付与API安全全球领导者,F5围绕“应用”这一核心载体,旨在链接算力、数据与行业应用,保障新一代智能应用安全、稳定、高效,为智能经济提供数字底座。
从ADC到ADSP:F5三十年的一次自我进化
回顾F5的发展历史,会发现这家企业始终围绕同一个核心命题展开创新——应用交付。
上世纪九十年代互联网兴起时,企业最关注的是应用能否稳定运行。F5凭借BIG-IP产品定义了ADC(应用交付控制器)行业标准,解决了流量激增背景下的扩展性和可靠性问题。进入云计算时代,应用开始跨越数据中心、公有云和私有云运行,ADC也从硬件形态逐渐演变为软件化、云化的平台能力。
而AI时代的到来,让应用再次发生质变。
F5北亚区总裁 黄彦文
黄彦文指出,AI流量本质上仍然以API形式存在,但复杂度已经远超传统互联网应用。过去一个请求对应一次响应,如今一次AI请求可能涉及多个模型、多种数据源以及多个智能体协同完成推理任务。应用不再只是一个APP,而成为由模型、数据、API和算力共同组成的复杂系统。
这种变化正在推动应用交付从ADC时代进入ADSP时代。F5提出的ADSP(Application Delivery and Security Platform,应用交付与安全平台)试图解决的不再只是访问速度问题,而是AI应用全生命周期中的交付、安全、治理与运营问题。
在黄彦文看来,应用始终是连接算力与生产力之间最重要的桥梁。无论数据中心如何升级、GPU如何迭代、模型如何变化,最终创造价值的依然是应用本身。F5所扮演的角色,就是让这些应用能够在任何环境中稳定、安全、高效地运行。
Token经济崛起:AI基础设施开始进入经济学时代
如果说大模型掀起了AI革命,那么Token则正在成为衡量这场革命价值的标准。在F5亚太区首席技术官Mohan Veloo看来,Token不仅是技术指标,更是正在演变为一种经济单位。它既代表计算资源消耗,也代表业务价值创造。企业未来衡量AI投资回报率,很大程度上将围绕Token展开。
F5亚太区首席技术官Mohan Veloo
这一变化意味着AI基础设施建设开始进入“经济学时代”。
传统IT建设关注服务器数量和存储容量,而AI时代企业更关心每个Token的成本、首Token生成时间、端到端延迟以及整体吞吐效率。性能不再只是技术指标,而是直接影响企业利润空间。
Mohan提到了一个颇具启发性的概念——“Tokenomics”,即Token经济学。其核心思想在于通过合理调度模型、算力和推理资源,实现成本与体验之间的平衡。
例如,一个查询天气的问题显然不需要调用最昂贵的大模型,而复杂代码生成任务则需要更强大的推理能力。如果所有请求都交给最高性能模型处理,企业将承担巨大的Token成本;如果全部采用低成本模型,又无法保证结果质量。
因此,多模型协同正在成为企业AI落地的重要趋势。
Mohan认为,这与早期云计算的发展路径十分相似。当云资源价格昂贵时,企业普遍采用混合云模式;而在AI时代,由于Token成本依然较高,企业开始采用混合AI模式,在不同模型之间动态调度资源。
这种变化意味着未来AI竞争不只是模型能力竞争,更是资源调度能力竞争。谁能以更低成本生成更多高质量Token,谁就拥有更强的商业竞争力。
TBLB背后:重新定义AI时代的负载均衡
在F5中国区产品及解决方案总经理陈亮看来,传统负载均衡已经难以适应AI推理场景。互联网时代,两个用户连接可能意味着相同负载;但在AI时代,一个用户要求生成天气预报,另一个用户要求完成万行代码重构,两者对算力资源的消耗完全不同。单纯按照连接数进行分配,必然导致资源浪费。因此,F5开始将负载均衡对象从“连接”转向“Token”。
陈亮介绍,TBLB(Token Based Load Balancing,本地化的基于词元(Token)的负载均衡解决方案)并非简单的流量分发机制,而是一套围绕推理任务展开的智能调度系统。在任务到达之前,系统会综合评估模型健康状态、GPU负载情况、队列长度、首Token时延、推理成功率以及缓存命中情况等多个维度,再决定请求应该进入哪个推理集群。
尤其是在异构算力环境中,这种能力变得尤为重要。
当前企业越来越多地采用混合算力部署模式。除了英伟达GPU之外,昇腾、寒武纪、沐曦、平头哥等国产算力平台也在快速发展。不同芯片架构、不同推理引擎和不同模型之间存在大量适配挑战。
F5希望成为这些异构资源之间的统一调度层。
陈亮表示,企业客户通常已经完成模型与芯片的适配工作,而F5负责解决的是运行阶段的动态调度问题。系统不仅关注哪个集群空闲,还会判断是否存在可复用的KV Cache缓存,从而避免重复计算,降低Token成本。
从实际案例来看,TBLB已经展现出明显价值。根据F5披露的数据,在多个客户场景中,并发用户数最高提升75%,首Token生成速度提升30%至99%,端到端访问效率也实现显著改善。
当AI应用规模不断扩大时,调度能力本身正在成为新的生产力。
AI安全进入“意图识别”时代
相比算力效率,另一个被广泛关注的话题是AI安全。随着大模型逐渐深入业务核心,传统安全体系正在面临前所未有的挑战。Mohan指出,过去安全系统主要依赖规则和特征库识别攻击行为。但AI攻击具有实时生成、自我进化和动态变化的特点,传统规则体系很难跟上攻击速度。
攻击者已经开始使用AI进行漏洞发现、自动化渗透和攻击代码生成,而企业仍然依靠人工分析和规则更新进行防御。机器速度与人工速度之间的差距正在不断扩大。
面对这一变化,F5选择用AI对抗AI。Mohan介绍,F5对WAF进行了底层重构,在传统特征匹配和威胁情报之外,引入神经网络模型进行实时安全决策。系统能够在微秒级完成行为分析,并直接运行在CPU环境中,无需依赖GPU资源,从而实现边缘部署和实时防护。
陈亮进一步解释了AI护栏与传统规则引擎的区别。传统规则系统更像关键词匹配机制,攻击者通过拆分字符、加入空格或符号便可能绕过检测。而AI护栏则基于语义理解和意图识别,即便表达形式发生变化,系统仍能够理解其真实目的。
换句话说,过去安全防御关注“说了什么”,而现在更关注“想做什么”。这种从模式识别向意图理解的转变,也正在改变AI安全行业的发展方向。
借助收购CalypsoAI积累的能力以及自身三十年的应用安全经验,F5构建起从AI红队到AI护栏的完整体系。红队负责发现漏洞,护栏负责自动生成防御策略,并通过持续学习不断更新防护能力。在F5北亚区区域副总裁产及解决方案资深架构咨询师张振伦看来,网络安全已经从企业的可选项变成必选项。从GDPR到各国数据安全法规,再到AI时代的新型风险,企业必须建立覆盖应用、API、模型和智能体的完整安全体系。
未来的竞争不只是模型能力竞争,更是安全治理能力竞争。
中国创新走向全球:F5的新战略坐标
值得关注的是,在AI时代的战略布局中,中国市场正在扮演越来越重要的角色。
黄彦文透露,F5中国今年将战略从“创新中国,服务中国”升级为“创新中国,链接全球”。
这一变化背后,是中国市场在AI实践中的独特价值。
与北美市场更加关注通用大模型不同,中国企业正在快速推动行业模型和产业AI落地。从新能源汽车、高端制造到医疗健康,大量场景开始形成具有中国特色的AI应用模式。与此同时,中国市场对于异构算力、多模型协同以及成本优化的需求也更加迫切。
黄彦文表示,F5正式成立AI应用工程部,中国团队已经成为其中的重要组成部分。包括TBLB在内的多项创新实践,都正在从中国走向全球。
这种反向输出并非偶然。
一方面,中国拥有全球最丰富的AI应用场景;另一方面,复杂的本地生态迫使企业必须解决多模型、多芯片、多云环境协同问题。正是在这样的市场环境中,催生了大量具有全球价值的技术创新。
从这个意义上看,中国不仅是F5的重要市场,更正在成为其AI战略的重要创新源头。
未来,无论是AI安全、Token调度还是异构算力管理,中国市场积累的经验都可能成为全球AI基础设施建设的重要参考样本。
结语:
过去两年,全球科技产业的焦点几乎全部集中在大模型能力本身。但随着AI逐渐进入产业化阶段,一个越来越清晰的趋势正在出现:真正决定AI价值释放速度的,未必是模型参数规模,而是模型背后的基础设施体系。
当企业同时运行多个模型、多个云平台以及多种算力资源时,应用交付、安全治理和资源调度的重要性正在迅速上升。
从ADC到ADSP,从流量管理到Token治理,从规则安全到意图识别,F5试图证明一个观点:AI时代的竞争,已经开始从模型层下沉到基础设施层。而围绕Token建立的新型基础设施体系,或许正是下一轮智能经济竞争的真正战场。


