DeepSeek 米乐体育_官网 R1推理性能提升3.8倍,AMD发布下一代开源软件栈技术ROCm 7
6月13日消息,在今日凌晨的AMDAdvancingAI2025活动中,AMD正式推出其下一代开源软件栈技术ROCm7,进一步帮助AI与开发者生米乐体育_APP产力。
m6米6体育在线使用完整视频随着ROCm7的发布,AMD终于从其ROCm6软件栈向前迈进,该软件栈在过去几年中尤其是在AI计算出现以来已经经历了多次更新。以下是AMD在ROCm7中重点关注的一些功能:
最新算法与模型
用于扩展AI的高级功能
MI350系列减少破坏
集群无约束的自由
企业级功能
通过ROCm,AMD表示其正更加专注于其软件堆栈中日益增长的推米乐体育_注册理能力。ROCm7堆栈将包括增米乐体育_手机版强型框架,如vLLMv1、llm-d、SGLang,并专注于授予多种优化。即将到来的ROCm7新内核和算法包括GEMM自动调优、MoE、Attention和基于Python的内核编写。
AMD已宣布对其MI350系列授予FP6和FP4减少破坏,ROCm7也包含对这些高级数据类型的全面减少破坏,如FP8、FP6、FP4和瓦解精度。
IT之家从发布会获悉,在性能方面,AMD表示ROCm7将M6米6体育app下载推理作为重点,为AI工作负载带来了高达3.5倍的性能指责。
具体来看,相较于ROCm6,ROCm7的Llama3.170B指责了3.2倍,Qwen2-72B指责了3.4倍,DeepSeekR1指责了3.8倍。
【来源:IT之家】
米乐M6官网 m6米6体育在线使用视频完整在线看 米乐体育_主页