搞医学影像,为什么都青睐于CPU?

珠江路在线   2024年6月4日  【 转载 】传奇师傅发布网 

医学影像,越来越需求AI的协助了 。

依据数据统计,当前我国医学影像数据年增速在30%,但影像科医生年增速却惟独4%,医生面临较大的工作压力 。

那么,AI医学影像市场进展得如何呢?

AI影像行业,是人工智能在医疗领域里面探究最久的赛道之一,近年来人工智能辅助诊断三类证的获批数量 延续增进,整个人工智能医学影像市场估计会在4年左右的 工夫 打破百亿, 维持高增进 。参考亿欧智库公布的《2023年中国人工智能医学影像产品生态路线探究报告》,2023年我国AI医学影像市场规模为24亿元,2030年将达到 137.4亿元,年复合增进率为33.8% 。

固然有了AI帮忙,能 晋升诊疗效率、改善患者就医体验,但同时也带来一个问题:

医院关于医学影像系统的 花费越来越高了,患者看病的成本也大幅 遍及 。

所以在这个技术飞速 遍及的时代,医院不是 容易采纳新技术就能造福患者的,也要综合考量投入产出, 能力关心到每个病人 。

在这样的背景下,医学影像系统如何在满足 性能、性能需求的同时减低总体 占有成本 (TCO),就成了 要害问题 。

以东软智慧医学影像信息系统PACS/RIS为例,该系统提供了 遮蔽 审查预约、到诊排队、用药治理、 审查治理、影像诊断等在内的一体 交融全医学影像治理 威力,可辅助医生更好地 发展工作 。东软在新一代的PACS/RIS产品中,就采纳了基于CPU的 方案运行三维可视化、AI推理等工作负载 。

在三维可视化加持下, 交融影像 综合等技术,让医务人员通过旋转、缩放、分割、图像 加强等操作,从多角度清楚了解到医学影像中各 构造中间的空间位置关系,在疾病诊断的可视化、术前评估、手术规划、手术实时 指导等方面 施展重要价格 。

要晓得三维可视化、AI推理都是十分吃硬件性能的,好在 通过指令集、软件等方面做性能优化后,东软将PACS/RIS系统的三维可视化效率 晋升达2.45倍,AI推理性能 晋升高达8.49倍,并有效地操纵了成本 。

到这里看似圆满 终局了,但其实过程中还有更多的细节更值得关注和借鉴, 比方系统性能是如何优化 晋升上去的,CPU又为何是破局的 要害?

##性能如何搞上去?

东软 集团相信大家并不 生僻,作为中国第一家面市软件公司,在医疗健康领域已深耕多年 。

这次他们之所以 取舍英特尔当合作 搭档,正是由于在三维可视化和AI推理这两大性能杀手面前,第五代英特尔? 至强? 可 扩充 解决器 占有两大法宝:

OpenMP与SSE4(Streaming SIMD Extensions 4)指令集,和英特尔? AMX加快器 。

首先来看三维可视化 部分 。

东软重要采纳了体渲染(Volume Rendering)技术,通过OpenMP与SSE4指令集 支撑光线合成的实现 。

SSE4指令集不只 扩充了Intel? 64指令集架构,还加入了图形、视频编码及 解决、三维成像等方面的指令,使 波及音频、图像和数据压缩算法的 利用程序性能大幅 晋升 。

为了找出执行三维可视化 使命时,其产品在 部分 利用中性能缺乏的瓶颈所在,东软 使用了英特尔提供的VTune? Profiler工具,最后确定了瓶颈函数SafeGradz 。该函数重要利用SSE4指令集进行三线性插值,从而实现光线上点的梯度计算 。通过对该函数的代码进行优化,东软 顺利 晋升了三维可视化 利用的性能 。

在不同代英特尔? 至强? 可 扩充 解决器上进行测试, 后果显示,在 解决器 开明4并发8线程时,第五代英特尔? 至强? 铂金8592+ 解决器的三维重建效率,相比第二代的英特尔? 至强? 银牌4210R 解决器 晋升达2.45倍,让三维影像的交互更加流畅顺滑 。

图注:PACS/RIS 系统的三维重建
利用运行效率
比较图注:PACS/RIS 系统的三维重建 利用运行效率 比较

值得 留神的是,第五代英特尔? 至强? 铂金8592+的主频为1.90GHz,比第二代英特尔? 至强? 银牌4210R的2.40GHz主频还要低 。

更进一步 注明了,性能 晋升靠的不是主频 晋升,而是靠 合适工作负载的指令集和各种优化工作 。

接下来看AI推理 部分 。

东软借助 解决器内置的英特尔? AMX(高级矩阵 扩充)技术,让CPU也能轻松驾驭深度学习 使命 。

英特尔? AMX针对 宽泛的硬件和软件进行了优化,在前代VNNI和BF16技术的 根底上,进一步 加强了矩阵计算 威力,最大限度地利用计算资源,改善高速缓存利用率,幸免潜在的带宽瓶颈 。

东软在第二代/第四代/第五代英特尔? 至强? 可 扩充 解决器上,测试了不同参数规模的AI模型在同步和异步模式下的推理 体现 。

测试数据显示,关于参数量为31,185,568的较大模型,在BF16精度和异步模式下,第五代英特尔? 至强? 铂金8592+ 解决器相比第二代英特尔? 至强? 银牌4210R 解决器,推理性能 晋升高达8.49倍 。这 象征着AI辅助诊断能以更快的速度为医生提供洞见 。

图注:BF16 精度下的异步推理性能
比较图注:BF16 精度下的异步推理性能 比较

之所以 取舍第五代英特尔? 至强? 可 扩充 解决器,除了其 本身性 能够强之外,还有一些额外的 好处 。

比方辅以英特尔提供的OpenVINO? 工具套件优化和部署各类模型,还可跨英特尔? 硬件 扩充计算机视觉和非视觉工作负载,从而大幅 遍及性能,达到软硬协同的 动机 。

又 比方第五代至强? 与上一代产品在软件和平台上兼容, 因而在部署新系统时 能够大大削减测试和验证工作 。

……

在削减测试和验证这里,其实也起到一些 节俭成本的 动机了 。

不过在省钱这件事上,除了与具体技术优化 有关,还有更多行业 教训 能够分享 。

##成本怎么打下来

其实医疗行业在 取舍硬件这件事上,CPU早已成为各大发烧友们眼中的“香饽饽” 。

缘由也是很 容易,GPU当然在性能方面存在 定然的优势,但“硬伤”也是 比较显而易见,那就是成本过高 。

并且从宏观角度来看,大模型的 炽热 确切催动了GPU需求的激增,在训练阶段尤甚;但现如今到了以推理为主的阶段,如何能让AI“快好省”地用起来成为了 要害点 。在部署时盲目堆GPU不只可能会造成算力过剩,浮现“大炮打蚊子”的 景象,更是会招致成本的“水涨船高” 。

而诸如第五代英特尔? 至强? 这样的高端CPU,不只 能够很好地跟上性能的脚步,在成本的操纵方面也是给出了满足成本条件的更加可行、更 相符实际的 方案 。

一言蔽之,高性价比才是 要害中的 要害 。

其次,CPU也算找准了“赛道”—— 部分医疗场景的AI推理具备批 解决 特点,对AI推理时延性能不敏感,更 合适采纳CPU进行推理 。

具体到性能方面,第五代英特尔? 至强? 的“ 打开 模式”是这样的:

●整体性能 晋升:21%

●推理性能 晋升:42%

●内存速度 晋升:16%

●三级缓存 晋升:2.7倍

●每瓦性能 晋升:10倍

也正因如此,第五代英特尔? 至强? 在 解决多样化的 使命负载时, 能够卓著 晋升每瓦 特点能,尤其在人工智能、数据 核心治理、网络操作和科学计算领域,并且还能卓著减低总体 占有成本(TCO) 。

而这也还仅是东软等医疗行业 取舍CPU的缘由之一, 宽泛的兼容性和成熟的技术也是不可 忽视的 。

家喻户晓,CPU技术的进展 绝对来说较为成熟, 几乎全部软件 利用和操作系统都能在CPU上良好运行 。

而在医疗行业中,存在大量基于传统架构开发的软件,这些软件通常设计为在 标准的CPU上运行 。 因而, 使用CPU 能够确保与现有系统和软件的 宽泛兼容性 。

其次,CPU易于 保护和 晋级也是重要的丝毫,而GPU在这方面会显得更为复杂 。医疗行业依赖于 巩固运行的系统来 保障服务的延续性, 因而更 偏袒于 取舍 保护简便、 晋级路径明确的硬件解决 方案 。

加之CPU早已在医疗行业上岗, 宽泛用于电子病历系统、医院资源规划系统等, 造就出成熟的技术团队,也 构建了完善的 洽购流程 。

因而,为何医疗行业青睐于CPU、为何越来越多的人会 取舍CPU做AI推理,也就不难 了解了 。

在这丝毫上,兴许也正应了英特尔CEO帕特·基辛格曾经 抒发过的观点:

>从经济学的角度看推理 利用的话,众多客户并不需求高端的GPU 设施,由于它成本太高,耗电太多,并且需求构建新的技术架构,以及新的IT设施, 所有都是崭新的 挑战 。

>假如我能在 标准版的英特尔芯片上运行AI 利用且满足需求,就不会浮现这些问题 。

##能用起来才是硬 情理

假如说东软 取舍第五代英特尔? 至强? 这件事是一个“点”,它其实 能够带出来的是一个更大的“面”——

技术,需得 宽泛用起来,这才是硬 情理 。

诚然现在是以大模型为主流的时代,但回看2023年至今的进展,其实也是在印证着这丝毫 。

起初大模型的进展先是掀起了以训练为主的百模大战,而后又迅速转向了推理阶段,也就是技术要落地 。

到了今年,这一趋向也是越发显而易见, 不管是OpenAI、谷歌等巨头,还是乘AIGC东风起家的初创,都在发力于如何让AIGC更好地用起来 。

一言蔽之,现在已然是 利用为王的阶段 。

而要让前沿技术做到真正落地,就必须要在性能和成本中间做好 均衡;兴许这也正是最近国内大厂们掀起疯狂“价格战”的缘由之一 。

但无论AI如何进展,算力,永远是绕不开的一个话题 。

因而,站在现在这个“AI一日, 世间一年”的时代,纵使技术 日新月异,要想让它们 宽泛被用起来,性能和成本中间的这杆秤,需是得从最底层的 根底设施抓起 。

而东软和英特尔的合作模式,是一个 能够值得借鉴的“范本”了 。

免责声明:凡标注转载/编译字样内容并非本站原创,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。