首页 >> 动态 >

英特尔数据中心GPUFlex系列获得新的TensorFlow加速

2022-11-15 11:10:59 来源: 用户: 

TensorFlow允许一个用于AI机器学习模型的平台来准备、构建、部署和实施多个软件和硬件选项。最近,谷歌和英特尔创造了一种方法,让各种硬件制造商在不改变原始代码的情况下发布对数据中心设备的产品支持。这种新机制称为PluggableDevice。今天,英特尔宣布他们已将其英特尔数据中心GPUFlex系列添加到PluggableDevices系列中,称为IntelExtensionforTensorFlow。

英特尔和谷歌团队成员联手通过新的IntelExtensionforTensorFlow打造全新的TensorFlow加速

英特尔和TensorFlow的这一新实施将允许英特尔数据中心GPUFlex系列硬件和该公司的英特尔Arc图形。它通过连接到oneAPI与Linux和适用于Linux的Windows子系统兼容。OneAPI是开源编程模型标准,允许开发人员利用各种加速架构。

英特尔数据中心GPUFlex系列获得新的TensorFlow加速2

IntelExtensionforTensorFlowPluggableDevice实现。图片来源:张量流。

该插件虽然易于启动,但将允许开发人员使用将C++与SYCL编程模型相结合的各种CAPI模型。

设备管理:英特尔和谷歌开发人员利用C++和SYCL以及oneAPISYCL运行时(DPC++LLVMSYCL项目)提供的一些特殊支持,实现了TensorFlow的StreamExecutorCAPI。StreamExecutorCAPI定义了流、设备、上下文、内存结构和相关函数,所有这些都具有到SYCL运行时中相应实现的简单映射。

操作和内核注册:TensorFlow的内核和操作注册CAPI允许特定于设备的内核实现和自定义操作。为了确保足够的模型覆盖率,开发团队匹配了TensorFlow原生GPU设备的运算覆盖率,通过从oneAPI深度神经网络库(oneDNN)调用高度优化的深度学习原语来实现大多数性能关键型运算。其他操作通过SYCL内核或Eigen数学库实现到带有SYCL的C++,以便它可以生成程序来实现设备操作。

图优化:Flex系列GPU插件通过GraphCAPI优化Grappler中的TensorFlow图,并通过oneDNNGraphAPI将性能关键图分区卸载到oneDNN库。它从TensorFlow接收一个protobuf序列化图,反序列化图,识别并用自定义操作替换适当的子图,然后将图发送回TensorFlow。当TensorFlow执行处理后的图形时,自定义操作会映射到oneDNN的优化实现,以用于其关联的oneDNN图形分区。

ProfilerCAPI允许PluggableDevices以TensorFlow的原生分析格式传递分析数据。Flex系列GPU插件从TensorFlow获取一个序列化的XSpace对象,用通过oneAPILevelZero低级设备接口获得的运行时数据填充该对象,并将该对象返回给TensorFlow。用户可以使用TensorFlow的分析工具(如TensorBoard)在Flex系列GPU上显示特定操作的执行分析。

对于有兴趣了解有关新集成的更多信息的各方,您可以查看IntelExtensionforTensorFlow博客页面以了解更多详细信息。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章