都已经2021年了，AMD的APU为什么没有大放光芒？

2021年，高性能计算，AI计算需求猛涨，intel 在搞avx512被骂的很惨，AMD的apu有潜力，却仍没有大放光彩，为什么呢？

有关回应 · 2021-5-31 14:19:49

在家用游戏机领域，如果不考虑掌机，那么UMA架构的定制AMD APU在2013年之后的市占率是100％。两家主要客户在这几年间开发了3代产品，且一改主机向下兼容难的处境，将基于AMD64与AMD GPU的游戏生态一直延续至今。PS5与Xbox Series主机在这半年不到的时间内总共已经售出接近千万台，几乎等同于NVIDIA与AMD全年销售的独立显卡总数（这包括RX 550那种亮机卡，或者MX450那种机都亮不了卡），已经可以用大放光芒来形容了。
但是我猜想题主更希望了解的是个人计算领域。
APU HSA作为AMD早些年应对CPU性能不佳的营销、宣传手段，由于软件支持几乎不存在，在个人计算领域难堪大用。而这一点我想没有谁比AMD自己更清楚。
2017年之后AMD的CPU性能逐渐回到正轨，自然也没必要继续把面向个人计算的IGPU和HSA生态作为卖点。在2021年，PC平台上的HSA生态已经处于废弃状态，APU的核显基本仅能用于日常办公或轻度游戏。
当今，连能完全利用APU HSA特性的GPGPU SDK和runtime都难找到，例如现在没有任何一个受支持的SDK可以实现将用户进程malloc的指针送到GPU上，直接由GPU访问内存，而这是APU HSA区别于独立显卡GPGPU运算的一个重要特性。
现在能找到的最新的文档是2017年AMD ROCm HC（C++ AMP的精神续作）的文档上关于APU的描述。

表面上看一切都是显得那么的完美，除了以下两点：

ROCm HC从未官方支持Windows，更是从未官方支持APU，本身与个人计算无缘
HC于ROCm 3.5被宣告废弃，4.1.1版本正式移除。ROCm现在仅支持HIP（CUDA改名仿制品）、OpenCL（基本已经死了）与OpenMP。
听说是因为没人用CUDA以外的那些环境。

所以并不是“都已经2021年了”APU还没有在个人计算领域大放光芒，而正是因为已经到了2021年，APU帮AMD熬过了2017年之前那段最艰难的时期，现在已经不再是AMD的重心所在了。开发者想去利用UMA特性开发应用去给HSA生态添砖加瓦都很难。
真正的生产力用户购买的都是这些产品，你能想象他们去用核显吗？

有关回应 · 2021-5-31 14:19:50

[h1]因为这货不适合PC[/h1]首先，没有人想要一台没有软件的硬件（收藏除外），我们要的是运行某一系列软件的硬件平台。

然后，开发软件有两种方式：

硬件主导：选定某个硬件平台，然后这个平台能提供什么样的功能和性能，在这个基础上去设计做哪些功能，确认这些功能可以处理多大规模的数据。主机游戏开发基本就是这种方式，有一个游戏创意，然后选定某一款或者多款主机，然后在主机的硬件性能范围内确定游戏的具体细节。
需求主导：从实际业务出发，需要解决什么问题，为了解决这些问题需要有哪些功能，硬件应该具备什么样的性能——这种方式，往往是相对抽象而通用的，例如开发一个学生管理系统来登记学生信息，可以只用来登记一个班的学生，也可以用来登记整个城市的学生。这类软件，数据量取决于实际业务需要或者当前硬件上限。

游戏主机就不多说了，APU已经一统天下了。事实上手机、平板上的游戏也是这样，不展开了，这里单说PC。

PC上的软件，绝大部分都是需求主导，因此对硬件的性能要求往往差异很大。一个文档处理软件，可以用来写一两页的作业公文，也可以用来处理上千万字的长篇小说——要是你嫌太长打开太慢可以自己分成几十卷；一个聊天软件，可以仅仅用于情侣之间的私密聊天，也可以给某个销售人员用来和几百上千个客户沟通……

因此，不同的用户，即便都用相同的软件，对硬件的性能需求可能会有极大差异。同样是用Photoshop处理图片，有人只是把手机照片上的痘痘抹掉发个朋友圈，随便一台主流配置的电脑都够用；有人用来创作大型户外广告图片，顶配的高端工作站可能一个操作还要卡半天。这还只是桌面应用，要是企业级应用，一家小微企业搭个网站展示几款产品，一个月访问量可能都没有一百人，随便一台低功耗的NAS都够用；一个全国知名品牌的企业网站展示几百上千款产品，可能一天访问量就数百万，顶配的单台服务器都不够用需要上集群。

所以，从PC诞生至今，可扩展性一直都是一个很重要的参数。可能很多朋友觉得，我买电脑都没看过什么扩展性，哪里重要了？事实上，大家买电脑的时候，厂商提供的多种配置就是扩展性的体现。一个型号的电脑产品，CPU有i3/i5/i7，内存有8G/16G/32G，显卡有核显独显，独显还有很多种型号如1650/1660/3060/3070/3080…，硬盘大小有256G/512G/1T/2T…哪怕是无法自行更换CPU、显卡、内存的轻薄型笔记本，通常都是有若干种配置，来应对不同用户的使用需求的；各种配件都可以自行搭配更换的台式机、服务器，就更不用说了。

看到这里，可能有的朋友说答主你啰啰嗦嗦说了这么多，和APU有什么关系？那么正式回答问题，就是：
[h1]APU的扩展性太差，不适合PC[/h1]把不同规格的CPU和GPU集成在同一块晶片上，以今天的技术来说并不是难事。但这样势必会导致出现多种CPU+GPU的组合，而且大部分组合的产量都会很小，对于半导体的生产流程来说，这会大幅提高生产成本。AMD这几年的锐龙翻身，很重要一个原因就是单个的CCD芯片通用于桌面、高端工作站、服务器，通过单块基板上封装不同数量的CCD芯片来满足不同的性能需求场合，大幅降低了代工生产的成本，所以在前期的Zen/Zen+/Zen2单核性能没有优势甚至劣势明显时，可以在同等或者略低的价位提供更多的核心从而获得更高的多线程性能，从Intel手上抢下了大量市场份额。毕竟Intel是自己的工厂，而且销量比AMD高得多，摊下来的单个产品成本，理论上来说Intel比AMD要更低不少。而锐龙的单基板多芯片封装路线，某个角度来说和APU是背道而驰的。

除了CPU和GPU组合过多外，APU还会面临另一个问题：存储规格。
高性能的GPU对存储带宽是非常渴求的，在显卡上是通过PCB上焊接不同数量的显存颗粒来实现。但这里有个前提，就是游戏显卡的应用相对单一，对显存容量的要求是相对确定的。如果是面向现实需求的设计向、计算向，对显存容量的需求往往会有很大差异，显卡厂商只能提供大容量显存配置来解决，所以Geforce最高规格的3090是24GB显存，但面向工业设计的Quadro路线的顶配产品RTX A6000，直接提供48GB显存，面向计算的Tesla路线的A100，更是提供了40/80GB两种显存配置。但大显存无疑会大幅提升产品成本，对于财大气粗的企业应用来说还可以接受，但对于消费用户来说，这显然是无法接受的。

所以，不同档次的GPU对存储带宽的要求需要集成不同数量的存储颗粒，不同用户的使用场景又要求不同的存储容量，带来的后果就是每种规格的APU都需要若干种主板设计且无法通用，如果再考虑主板的档次划分，要有多种大小规格，集成不同功能，提供不同数量的硬盘、板卡接口等等，市场上将会出现无数的主板型号，而且单块主板的研发、生产成本也会大幅上涨。

所以，除非有一天，最低配置的GPU和存储方案都能提供绝大部分用户需要的性能——正如今天的核显一样，只要不玩大型游戏，处理2D图形、视频编解码和简单3D效果都是足够的，那个时候才是APU在PC上大放光芒的时候——但那时又有谁会关心它放不放光芒呢？你们关心过声卡、网卡有没有大放光芒么？

有关回应 · 2021-5-31 14:19:51

技术方向的问题都被大家说烂了，
就不多说了。
APU有个商业逻辑的问题一直没解决，
例如2400g的die比1700的die还要大，
但是2400g卖1000多，
1700却可以卖到2000以上，
(两个价格皆为首发价格)
按晶圆成本2400g是大于1700的，
但是实际售价却是反回来的。
因为消费者能接受的2400g的价格是1400(与2400g同为4c8t)+Vega11大概的价格
贵太多了就没人买。
如此看来APU确实有点吃力不讨好，
到了zen2时代索性把桌面APU变成仅限OEM了。
有高赞提到Renoir(zen2 apu)，
诚然，Renoir的确为AMD在笔记本市场开创了前所未有的成功，
但是背后的原因呢？
是因为强GPU吗？
说起来，Renoir的GPU流处理器比上代还缩水了。
还是因为平价卖8核？
背后的答案不言自明。

有关回应 · 2021-5-31 14:19:52

APU事实上已经在笔记本和游戏机领域大放光芒了，OEM整机也在稳步发展，但我想题主问的显然不是这个。
高性能计算和AI，真正干活的直接上多路多卡，对细分性能有需求就上不同硬件，这显然跟硬件确定就无法更改的APU需求完全不同，可以说在这方面APU也毫无潜力。
大家点进来这个题目应该主要还是关心DIY领域的APU，大家首先要明白一个概念，就是在DIY领域，APU本质上是中低端产品线，但凡DIYer有需求，搞一个远强于核显的独显轻而易举。而现在的8核APU显然是不能作为低端产品卖的，强行屏蔽4核这种硅渣再利用你看3100就知道，成本划不来，AMD也不愿意多供货。而真正的中低端产品（4核及以下），AMD目前是缺席的，还在靠两年前的ZEN1APU维持场面。至于一小部分ITX核显党，这部分人的问题就是人太少了，根本无法维持一条芯片产品线。
基于此，加上目前全球缺芯的大环境，AMD目前的策略是，1主流APU不零售主供OEM（有需求的玩家自会搞到散片），2核显部分使用少核高频策略性能摸到主流双通道带宽上限即可（省成本），3尽快量产梵高4核ZEN2+Navi低端APU。
可以说目前APU在DIY产品线不大放光芒是AMD在全球缺芯情况下有意为之结果了。

有关回应 · 2021-5-31 14:19:53

两方面可以说：
往好的方面说是AMD在等DDR5，差的方面说就是AMD做RDNA2核显出了点问题导致推迟。
后续产品能看到ZEN2+RDNA2和“ZEN3+”+RDNA2的APU，并且今年DDR5应该是能够商用了。从这个组合来看我个人的猜测是：RDNA2核显的面积要大于Vega核显。ZEN2用7nm且面积小于ZEN3，“ZEN3+”用6nm能塞下更多晶体管，所以ZEN2和“ZEN3+”都能用上RDNA2核显。综合来看ZEN3用7nm没有足够的面积塞下RDNA2。
3400G有RX Vega 11 Graphics而到了4000和5000系核显都最高为8组单元，通过优化提频来升级，所以这几代的APU确实可以说是原地踏步。
从11代酷睿的XE核显来看，性能强点的核显都非常吃内存的频率，11代酷睿配上LPDRR4X 4266MHZ能超过MX350，弱于MX450。苹果的M1也是4266的内存，M1的核显是强于1050ti大概等于1650的水平。
你想要的APU大放异彩那也得等到“ZEN3+”+RDNA2+DDR5的组合出现，从苹果M1的核显来推测的话，这个组合超过1650应该没什么问题，如果能达到1660ti或者2060的水平那么对于绝大多数用户来说都不必再买显卡了。那么也就是APU大放异彩的时候了

都已经2021年了，AMD的APU为什么没有大放光芒？

5 个回复