前端不得不知道的
|
PGA具有优势。硬件逻辑、计算内核和内存配置可针对特定类型的神经网络进行定制,从而使其更有效地处理预训练模型。但是,一个缺点是与CPU或CUDA相比编程困难。如上一节所述,OpenCL将有助于使FPGA对软件开发人员更加友好。 除了FPGA之外,Google还制造了定制的处理器,称为TPU。它是一种专注于高效矩阵计算的ASIC。但是,仅Google自己的服务支持该功能。
以下是DL云推断中的一些参与者。 GPU / CPU的替代品 替代品来了。 Khronos在2009年提出了OpenCL,这是一种用于在各种硬件(例如CPU、GPU、DSP或FPGA)上进行并行计算的开放标准。它将使其他处理器(如AMD GPU)进入DL培训市场,为开发人员提供更多选择。 但是,它在DL库支持方面仍落后于CUDA。希望这种情况在未来几年内会有所改善。英特尔还通过收购Nervana开发了针对DL培训定制的处理器。 DL推理的竞争格局 DL推理是一个竞争激烈的市场。通常可以根据用例的要求在多个级别上部署应用:
云推理 在Google、Facebook、百度或阿里巴巴等互联网巨头的大力推动下,云推理市场将实现巨大的增长。例如,Google Cloud和Microsoft Azure提供了非常强大的图像分类、自然语言处理和面部识别API,开发人员可以轻松地将其集成到他们的云应用中。 云推理平台将需要可靠地支持数百万并发用户。扩展吞吐量的能力至关重要。此外,降低能耗是控制服务运营成本的另一个重中之重。
在云推理空间上,除GPU外,数据中心还使用FPGA或定制处理器来使云推理应用更具成本效益和功效。例如,Microsoft Project Brainwave使用英特尔FPGA来证明在运行诸如CNN、LSTM等的DL算法时的强大性能和灵活性。 (编辑:孝感站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
