最新搜看股票
报价
| 返回 放大 + 缩小 - | |
|
腾讯混元AI Infra核心技术开源:推理吞吐提升30%
推荐 9 利好 18 利淡 6 格隆汇新闻
|
|
|
|
| 2月4日|腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。在真实场景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 QPM 提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比 FlashInfer/FlashAttention 最高提升2.22倍;GroupGEMM 相比 DeepGEMM 最高提升1.88倍;FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。新闻来源 (不包括新闻图片): 格隆汇 | |
|
免责声明 : 以上资讯仅供参考。AASTOCKS.com Limited对以上资讯的内容不承担任何责任,对其准确性,完整性,品质,及时性,或可靠性不作任何陈述或予以认可,并明确表示不对任何由本资讯的全部或部分内容引致之损失或损害承担任何法律责任或为其引起的损失负责。以上资讯或反映了相关文章或专题作者的的个人意见和观点,并不代表AASTOCKS.com Limited的立场。以上资讯的任何内容均不构成AASTOCKS为任何投资作出招揽丶提出要约丶意见或推荐,或对任何证劵或投资的收益或是否合适提供法律丶税务丶会计丶或投资意见或服务。投资者必须按其本身投资目标及财务状况自行作出投资决定。
|
|
