全球科技界的目光聚焦即将于拉斯维加斯开幕的CES 2025展会。作为全球技术趋势的风向标,今年展会的重头戏无疑是端侧AI技术的突破进展。英伟达内部专家预测,端侧AI将在轻量化模型、多设备协同和行业应用上实现跨越式发展,成为展会最大的热点。然而,这场变革也对算力基础设施提出了新要求。

在端侧AI快速发展的背景下,中国算力基建是否准备充分?记者专访了科默罗技术的首席运营官(COO)汤浩。他从分布式算力的角度,分析了当前中国算力基建的误区,呼吁业界转变观念,推动集中与分布协同发展的算力新生态,以抓住端侧AI带来的战略机遇。

端侧AI:算力生态的转折点

“端侧AI的核心特点是低延迟、高实时性以及广泛的设备分布,这决定了单纯依赖集中式算力模式是远远不够的。”汤浩在专访中开门见山地指出。

端侧AI的典型应用场景包括自动驾驶、工业机器人和物联网设备,这些都对算力提出了“本地化”需求。例如,自动驾驶需要毫秒级的反应速度,工业机器人在生产线上的实时调整也要求极高的延迟敏感性。这些任务如果完全依赖集中式算力中心处理,受限于数据传输延迟和网络带宽,很难实现理想效果。

“这并不是要否定集中式算力的价值,”汤浩强调,“在大规模模型训练、复杂算法优化等领域,集中式算力仍然不可替代。但是端侧AI时代的需求变化,迫使我们必须重新审视算力基础设施的整体布局,推动集中式与分布式算力协同发展。”

分布式算力:端侧AI的核心支柱

根据英伟达的预测,分布式算力将在端侧AI时代扮演关键角色,其核心在于通过“端-边-云”协同架构,灵活调度算力资源,以满足多样化的场景需求。

汤浩举例说明了分布式算力在具体场景中的价值。例如,在智能制造领域,工业机器人可以通过边缘节点处理实时计算任务,而更复杂的算法优化和数据分析则由云端完成。这种分层计算模式不仅提升了系统的响应速度,还有效降低了整体算力成本。

科默罗技术近年来一直致力于推动分布式算力生态的落地。汤浩透露,公司除了为客户提供AI算法优化、芯片集成包等技术服务外,还帮助规模较大的品牌客户搭建企业级私有分布式算力网络。这一网络通过算力动态调度和资源分布优化,能够显著降低企业对集中式算力中心的依赖,同时提高计算效率和数据安全性。

“我们的目标是为客户提供定制化的分布式算力解决方案,让企业在端侧AI时代的竞争中占据主动。”汤浩说。

集中式算力的价值与短板

尽管分布式算力的应用场景在扩大,但集中式算力中心在许多领域仍然具有不可替代的核心作用。汤浩指出,集中式算力目前是支持大规模AI模型训练和复杂数据处理的关键设施。例如,像GPT-4这样的大型语言模型,需要集中式算力中心的高密度资源才能实现高效训练。

然而,他也坦言,集中式算力模式在以下几个方面存在明显短板:

• 网络延迟:对于实时性要求高的场景,例如自动驾驶,数据传输的延迟会直接影响决策速度。

• 能源与成本问题:集中式算力中心的建设和运营成本高昂,尤其是在能耗和碳排放方面,限制了其规模化发展。

• 资源分布不均:在地理分布广泛的场景中(如远程工业物联网设备),集中式算力的覆盖效率较低。

“集中式算力的价值在于提供顶层资源支持,但我们不能因为它的重要性而忽略了分布式算力的潜能。”汤浩总结。

分布式算力:技术实现的关键点

推动分布式算力大规模落地仍然面临许多技术挑战。汤浩进一步分析了当前的技术瓶颈:

1. 边缘设备性能优化

边缘节点往往受限于硬件性能,难以完成复杂的AI推理任务。解决这一问题需要依赖低功耗AI芯片的进一步发展,以及量化(Quantization)、剪枝(Pruning)等模型优化技术。

2. 算力调度与负载均衡

分布式算力网络中,各节点间的任务调度和资源分配需要高效的算法支持。这涉及动态负载均衡、容错机制以及实时资源监控等技术。

3. 数据一致性与隐私保护

在分布式环境下,如何实现数据传输的一致性和隐私保护是一个重要问题。技术手段包括联邦学习(Federated Learning)、同态加密(Homomorphic Encryption)等。

汤浩表示,科默罗技术正积极探索这些领域的解决方案,并希望通过与产业链上下游的合作,加速分布式算力技术的成熟与普及。

中国算力基建的战略调整:从集中执念到协同平衡

在谈到中国当前的算力基建现状时,汤浩毫不掩饰自己的担忧。他指出,近年来,各地政府在推动算力基础设施建设时,出现了一种“算力崇拜”的倾向,盲目追求投资规模和“大算力中心”的虚名,而忽视了实际需求和技术应用的多样性。这种做法不仅导致资源的浪费,还可能给未来的发展埋下隐患。

“不能为了搞算力而搞算力,算力基础设施的建设应该服务于实际的场景需求,而不是成为政绩工程的工具。”汤浩批评说,一些地方政府醉心于建设大型算力中心,热衷于宣传自己拥有多少PFlops的算力规模,却缺乏对算力分布优化的系统性思考和对分布式技术的投入。这样的单一化发展路径,不仅偏离了端侧AI时代的需求,还可能在未来造成算力资源的结构性浪费。

汤浩进一步指出,大型集中式算力中心虽然看上去“高端大气”,但并非越大越好。很多地方算力中心在建成后,实际利用率极低,出现“算力闲置”甚至“闲而无用”的现象,同时又承担着高昂的运营成本和能耗负担。他呼吁地方政府在规划算力基建时,必须跳出“贪大求全”的误区,更加注重投资的实际效益与算力布局的科学性。

“算力基建的目标是为产业提供支撑,而不是为了炫耀大算力集群的数据指标。”汤浩总结道,“端侧AI时代,只有在集中式与分布式算力之间找到平衡,才能真正让技术为社会发展服务,否则,我们可能既耗费了资源,又错失了全球竞争的先机。”

构建端侧AI时代的算力新生态

在CES 2025即将揭示端侧AI未来格局的关键时刻,中国的算力基础设施建设也正处在一个至关重要的转折点上。正如汤浩所言,端侧AI的全面爆发要求我们从“集中执念”中走出,以更加科学、平衡的方式构建集中与分布协同发展的算力新生态。这不仅是推动技术落地的需要,更是中国在国际竞争中抢占制高点的必由之路。

在这场智能革命的浪潮中,算力基建绝不能沦为简单的投资规模比拼和大集群的虚名追逐。相反,它应当是一场扎根实际需求、服务产业发展的深刻变革。未来的算力布局,不仅要满足端侧AI多样化的需求,更要体现技术与资源的最佳结合。

正如汤浩总结的那样,“算力的意义在于支撑技术创新和产业升级,而不是为了‘规模’而建。只有真正跳出盲目求大的误区,构建协同平衡的算力生态,中国才能在端侧AI时代占得先机。”

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

推荐内容