科教在线

上一篇:下一篇:
热门文章

【科技前沿】第22期:数据中心数据任务调度与故障处理关键问题研究进展

作者:发布时间:2022年04月25日 09时14分

【编者按】为了更好地营造校园学术氛围,传播我校学术科研动态,即日起,学校在校园网开辟“科技前沿”专栏,定期总结、回顾学校师生取得的科研成果。欢迎广大师生及时把自己的学术科研成果以邮件的形式告诉我们,我们希望获得您以下成果信息:为政府、企业、媒体进行了专业咨询;科技成果通过了相关鉴定;科技成果落地、实现产业化;发表了高水平的学术论文;获得了专利授权;出版、编著了专著、教材;获得了科技奖励;在重要学术会议上进行了发言……

我们愿意为有学术追求的师生搭建一个交流的平台,希望在师生的努力下,学校的学术氛围日益浓厚,让我们为实现电子信息特色鲜明的高水平大学而奋斗。联系邮箱:dwxcb@guet.edu.cn


近日,我校信息与通信学院仇洪冰教授团队成员叶苗老师与西安电子科技大学王宇平教授团队成员王晓丽老师在国际权威学术期刊《IEEE Transactions on Parallel and Distributed Systems》(TPDS)和《Neurocomputing》分别在线发表了题为“Resource and Energy Efficient Multi-Installment Large-Scale Workload Scheduling Strategy for Network-based Computer Platforms”和“A Method of RepairingSingle Node Failure in the Distributed Storage System Based on the Regenerating-Code and a HybridGenetic Algorithm”的学术论文。TPDS和《Neurocomputing》分别是CCF学会的A类和C类期刊,分别隶属于IEEE出版社和Elsevier出版社旗下计算机网络方向老牌期刊,现均为中科院2区和JCRQ1,2021年影响因子分别为2.67和2.108。

云存储数据中心的数据流任务调度和故障数据恢复是云存储系统需要解决的两种关键问题。多阶段调度(MIS)被认为是数据中心网络平台上一种很有前途的模式,它可以大大减少大规模分割工作负载的处理时间,但大量相关变量最优值的求取过于复杂使得MIS的实用性受到了削弱,为了克服这种复杂性,首先根据最优负荷分配矩阵的显式解析表达式提出了一种启发式算法来确定最优值,理论分析证明和大量的仿真证明所提算法的有效性,与其他调度策略相比不仅能最大限度地减少工作负载的处理时间,提高计算平台的资源利用率,而且大大降低了运行时间的,并使得能源浪费最小。而Erasure Code的数据冗余机制是可以有效提高存储空间利用率的数据组织形式,但在恢复数据时可能会导致较大的网络开销。在采用再生码修复故障节点的数据需要构造最优修复树,使瓶颈链路的带宽最大化,这是一个NP-hard问题,为了构造最优修复树,提出了一种混合遗传算法,综合考虑了网络拓扑结构和存储节点的链路带宽,设计了针对问题的互相关算子、变异算子和局部搜索算子,并对所提出的混合遗传算法给出了以概率1全局收敛性的数学证明。通过系列的仿真实验及其结果表明,该方法确定的最优修复树能有效地降低了分布式存储系统故障节点修复的延迟,提高了修复效率。

该研究工作得到了国家自然科学基金、广西自然科学基金等资助。