恒生指数1 26,514.70 -332.62 1,789.07亿
国企指数1 8,960.65 -87.73 716.00亿
返回    放大 +    缩小 -
腾讯混元AI Infra推开源生产级高性能LLM推理核心算子库HPC-Ops 推理吞吐提升三成
2026-02-05 09:53:22
腾讯(00700.HK)旗下大语言模型腾讯混元AI Infra团队宣布,推出开源生产级高性能LLM推理核心算子库HPC-Ops,基於生产环境痛点,采用CUDA和CuTe从零构建,通过抽象化工程架构、微架构深度适配及指令级极致优化等,降低底层算子开发门槛,将核心算子性能逼近硬件高峰,实现性能突破。

在真实场景下,基於HPC-Ops,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比FlashInfer / FlashAttention最高提升2.22 倍;GroupGEMM相比 DeepGEMM最高提升1.88倍;FusedMoE相比TensorRT-LLM最高提升1.49倍。(jl/w)~

阿思达克财经新闻
网址: www.aastocks.com