资讯洞察

从ADC到ADSP，F5重构AI时代应用交付与安全体系

来源：作者：中国IDC圈发布日期：2026-06-09 访问次数：77

过去两年，AI产业经历了从模型竞赛到应用落地的快速演进。随着推理需求激增、智能体兴起以及企业级AI部署规模扩大，一个新的问题开始浮出水面：当每天数百万亿Token在全球网络中流转，谁来保证这些Token能够被安全、高效且经济地生产、调度与交付？

在F5 Solution Day 2026媒体发布会上，F5北亚区总裁黄彦文、F5亚太区首席技术官Mohan Veloo、F5北亚区区域副总裁产及解决方案资深架构咨询师张振伦，以及F5中国区产品及解决方案总经理陈亮，共同描绘了一幅AI时代基础设施的新图景。

在他们看来，AI时代真正的竞争，不再只是模型能力的竞争，而是围绕Token展开的新一轮基础设施竞争。作为应用交付与API安全全球领导者，F5围绕“应用”这一核心载体，旨在链接算力、数据与行业应用，保障新一代智能应用安全、稳定、高效，为智能经济提供数字底座。

从ADC到ADSP：F5三十年的一次自我进化

回顾F5的发展历史，会发现这家企业始终围绕同一个核心命题展开创新——应用交付。

上世纪九十年代互联网兴起时，企业最关注的是应用能否稳定运行。F5凭借BIG-IP产品定义了ADC（应用交付控制器）行业标准，解决了流量激增背景下的扩展性和可靠性问题。进入云计算时代，应用开始跨越数据中心、公有云和私有云运行，ADC也从硬件形态逐渐演变为软件化、云化的平台能力。

而AI时代的到来，让应用再次发生质变。

F5北亚区总裁黄彦文

黄彦文指出，AI流量本质上仍然以API形式存在，但复杂度已经远超传统互联网应用。过去一个请求对应一次响应，如今一次AI请求可能涉及多个模型、多种数据源以及多个智能体协同完成推理任务。应用不再只是一个APP，而成为由模型、数据、API和算力共同组成的复杂系统。

这种变化正在推动应用交付从ADC时代进入ADSP时代。F5提出的ADSP（Application Delivery and Security Platform，应用交付与安全平台）试图解决的不再只是访问速度问题，而是AI应用全生命周期中的交付、安全、治理与运营问题。

在黄彦文看来，应用始终是连接算力与生产力之间最重要的桥梁。无论数据中心如何升级、GPU如何迭代、模型如何变化，最终创造价值的依然是应用本身。F5所扮演的角色，就是让这些应用能够在任何环境中稳定、安全、高效地运行。

Token经济崛起：AI基础设施开始进入经济学时代

如果说大模型掀起了AI革命，那么Token则正在成为衡量这场革命价值的标准。在F5亚太区首席技术官Mohan Veloo看来，Token不仅是技术指标，更是正在演变为一种经济单位。它既代表计算资源消耗，也代表业务价值创造。企业未来衡量AI投资回报率，很大程度上将围绕Token展开。

F5亚太区首席技术官Mohan Veloo

这一变化意味着AI基础设施建设开始进入“经济学时代”。

传统IT建设关注服务器数量和存储容量，而AI时代企业更关心每个Token的成本、首Token生成时间、端到端延迟以及整体吞吐效率。性能不再只是技术指标，而是直接影响企业利润空间。

Mohan提到了一个颇具启发性的概念——“Tokenomics”，即Token经济学。其核心思想在于通过合理调度模型、算力和推理资源，实现成本与体验之间的平衡。

例如，一个查询天气的问题显然不需要调用最昂贵的大模型，而复杂代码生成任务则需要更强大的推理能力。如果所有请求都交给最高性能模型处理，企业将承担巨大的Token成本；如果全部采用低成本模型，又无法保证结果质量。

因此，多模型协同正在成为企业AI落地的重要趋势。

Mohan认为，这与早期云计算的发展路径十分相似。当云资源价格昂贵时，企业普遍采用混合云模式；而在AI时代，由于Token成本依然较高，企业开始采用混合AI模式，在不同模型之间动态调度资源。

这种变化意味着未来AI竞争不只是模型能力竞争，更是资源调度能力竞争。谁能以更低成本生成更多高质量Token，谁就拥有更强的商业竞争力。

TBLB背后：重新定义AI时代的负载均衡

在F5中国区产品及解决方案总经理陈亮看来，传统负载均衡已经难以适应AI推理场景。互联网时代，两个用户连接可能意味着相同负载；但在AI时代，一个用户要求生成天气预报，另一个用户要求完成万行代码重构，两者对算力资源的消耗完全不同。单纯按照连接数进行分配，必然导致资源浪费。因此，F5开始将负载均衡对象从“连接”转向“Token”。

陈亮介绍，TBLB（Token Based Load Balancing，本地化的基于词元（Token）的负载均衡解决方案）并非简单的流量分发机制，而是一套围绕推理任务展开的智能调度系统。在任务到达之前，系统会综合评估模型健康状态、GPU负载情况、队列长度、首Token时延、推理成功率以及缓存命中情况等多个维度，再决定请求应该进入哪个推理集群。

尤其是在异构算力环境中，这种能力变得尤为重要。

当前企业越来越多地采用混合算力部署模式。除了英伟达GPU之外，昇腾、寒武纪、沐曦、平头哥等国产算力平台也在快速发展。不同芯片架构、不同推理引擎和不同模型之间存在大量适配挑战。

F5希望成为这些异构资源之间的统一调度层。

陈亮表示，企业客户通常已经完成模型与芯片的适配工作，而F5负责解决的是运行阶段的动态调度问题。系统不仅关注哪个集群空闲，还会判断是否存在可复用的KV Cache缓存，从而避免重复计算，降低Token成本。

从实际案例来看，TBLB已经展现出明显价值。根据F5披露的数据，在多个客户场景中，并发用户数最高提升75%，首Token生成速度提升30%至99%，端到端访问效率也实现显著改善。

当AI应用规模不断扩大时，调度能力本身正在成为新的生产力。

AI安全进入“意图识别”时代

相比算力效率，另一个被广泛关注的话题是AI安全。随着大模型逐渐深入业务核心，传统安全体系正在面临前所未有的挑战。Mohan指出，过去安全系统主要依赖规则和特征库识别攻击行为。但AI攻击具有实时生成、自我进化和动态变化的特点，传统规则体系很难跟上攻击速度。

攻击者已经开始使用AI进行漏洞发现、自动化渗透和攻击代码生成，而企业仍然依靠人工分析和规则更新进行防御。机器速度与人工速度之间的差距正在不断扩大。

面对这一变化，F5选择用AI对抗AI。Mohan介绍，F5对WAF进行了底层重构，在传统特征匹配和威胁情报之外，引入神经网络模型进行实时安全决策。系统能够在微秒级完成行为分析，并直接运行在CPU环境中，无需依赖GPU资源，从而实现边缘部署和实时防护。

陈亮进一步解释了AI护栏与传统规则引擎的区别。传统规则系统更像关键词匹配机制，攻击者通过拆分字符、加入空格或符号便可能绕过检测。而AI护栏则基于语义理解和意图识别，即便表达形式发生变化，系统仍能够理解其真实目的。

换句话说，过去安全防御关注“说了什么”，而现在更关注“想做什么”。这种从模式识别向意图理解的转变，也正在改变AI安全行业的发展方向。

借助收购CalypsoAI积累的能力以及自身三十年的应用安全经验，F5构建起从AI红队到AI护栏的完整体系。红队负责发现漏洞，护栏负责自动生成防御策略，并通过持续学习不断更新防护能力。在F5北亚区区域副总裁产及解决方案资深架构咨询师张振伦看来，网络安全已经从企业的可选项变成必选项。从GDPR到各国数据安全法规，再到AI时代的新型风险，企业必须建立覆盖应用、API、模型和智能体的完整安全体系。

未来的竞争不只是模型能力竞争，更是安全治理能力竞争。

中国创新走向全球：F5的新战略坐标

值得关注的是，在AI时代的战略布局中，中国市场正在扮演越来越重要的角色。

黄彦文透露，F5中国今年将战略从“创新中国，服务中国”升级为“创新中国，链接全球”。

这一变化背后，是中国市场在AI实践中的独特价值。

与北美市场更加关注通用大模型不同，中国企业正在快速推动行业模型和产业AI落地。从新能源汽车、高端制造到医疗健康，大量场景开始形成具有中国特色的AI应用模式。与此同时，中国市场对于异构算力、多模型协同以及成本优化的需求也更加迫切。

黄彦文表示，F5正式成立AI应用工程部，中国团队已经成为其中的重要组成部分。包括TBLB在内的多项创新实践，都正在从中国走向全球。

这种反向输出并非偶然。

一方面，中国拥有全球最丰富的AI应用场景；另一方面，复杂的本地生态迫使企业必须解决多模型、多芯片、多云环境协同问题。正是在这样的市场环境中，催生了大量具有全球价值的技术创新。

从这个意义上看，中国不仅是F5的重要市场，更正在成为其AI战略的重要创新源头。

未来，无论是AI安全、Token调度还是异构算力管理，中国市场积累的经验都可能成为全球AI基础设施建设的重要参考样本。

结语：

过去两年，全球科技产业的焦点几乎全部集中在大模型能力本身。但随着AI逐渐进入产业化阶段，一个越来越清晰的趋势正在出现：真正决定AI价值释放速度的，未必是模型参数规模，而是模型背后的基础设施体系。

当企业同时运行多个模型、多个云平台以及多种算力资源时，应用交付、安全治理和资源调度的重要性正在迅速上升。

从ADC到ADSP，从流量管理到Token治理，从规则安全到意图识别，F5试图证明一个观点：AI时代的竞争，已经开始从模型层下沉到基础设施层。而围绕Token建立的新型基础设施体系，或许正是下一轮智能经济竞争的真正战场。

上一：降低数据中心运营成本企业更具竞争优势

下一：深度丨建一座GW级AI数据中心到底需要多少钱？