基于Slurm的深度学习高性能计算平台设计及其调度实现技术

E-science Technology & Application(2018)

引用 1|浏览5
暂无评分
摘要
传统上,HPC与解决大规模科学计算和相应大数据紧密结合.伴随着物联网、移动互联网时代的到来,数据呈现出前所未有的爆炸式的增长,给人类对数据的利用方式提出了新的命题与挑战.2012年,Hinton采用深度学习的方法以巨大的优势摘取ImageNet的桂冠,让人类看到了海量数据与人工智能相结合的巨大价值.HPC系统天然与深度学习无缝对接,本文将以高性能计算集群为基础,提供搭建一整套高性能的深度学习平台设计思路与实现,并以Slurm调度分布式TensorFlow进行海量数据的相关的测试实验.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要