一种在复杂环境中支持容错的高性能规约框架

Journal of Beijing University of Aeronautics and Astronautics(2018)

引用 0|浏览7
暂无评分
摘要
规约是并行应用最常用的集合通信操作之一,现存规约算法存在2方面主要问题.第一,不适应复杂环境,当计算环境出现干扰时,规约效率显著降低.第二,不支持容错,当节点发生故障时,规约被迫中断.针对上述问题,提出一种基于任务并行的高性能分布式规约框架.首先,该框架将规约拆分为一系列独立的计算任务,使用任务调度器以保证就绪任务被优先调度到具有较高性能的节点上执行,从而有效避免了慢节点对整体性能的影响.其次,该框架基于规约数据的可靠性存储和故障侦听机制,以任务为粒度,可在应用不退出的前提下实现故障恢复.在复杂环境中的实验结果表明,分布式规约框架具有高可靠性,与现有规约算法相比,规约性能最高提升了2.2倍,并发规约性能最高提升了4倍.
更多
关键词
high-performance high-performance,reduction,fault,framework
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要