当前位置:主页 > 科技论文 > 计算机论文 >

并行分布式网络模拟器PDNS容错技术的研究

发布时间:2023-05-26 19:41
  网络模拟,是研究网络行为、评估协议性能的重要方式。PDNS是应用非常广泛的一个并行分布式网络模拟器。然而,PDNS也面临着分布式应用难以回避的系统可靠性方面的缺陷。检查点/卷回恢复技术是实现系统容错的重要手段。通过在系统正常运行过程中设置检查点,保存任务的相关状态。在程序崩溃后,可以根据检查点文件中所记录的系统及进程的信息,将进程卷回至最近保存的正常运行状态继续执行,而不必重启任务,从而节省了大量的重复计算时间。 本文主要研究使用检查点/卷回恢复技术来提高PDNS的容错能力。分布式检查算法以单进程检查点算法为基础,对于PDNS而言,则需要首先实现分布式模拟中单个模拟进程的检查点容错。文章分析比较了单进程检查点算法不同实现层次之间的优缺点,然后基于Condor实现了用户级透明检查点。文章通过实验对该单进程检查点的性能进行了测试,并分析了其时空开销的规律。 PDNS检查点容错需要解决的第二个问题是如何备份恢复各个模拟节点之间的连接。在局域网中,PDNS通过TCP完成各个节点之间的交互。因此,文章对Linux中TCP连接通信过程进行了分析,在此基础上采用可装载内核模块的方式实现了PDNS各个...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题背景
    1.2 国内外研究现状
        1.2.1 检查点简介
        1.2.2 成型的检查点系统
    1.3 本文的研究内容与组织结构
第2章 PDNS与检查点恢复技术
    2.1 并行分布式网络模拟器PDNS
        2.1.1 PDNS简介
        2.1.2 PDNS检查点容错需解决的问题
    2.2 分布式检查点算法
        2.2.1 基本概念
        2.2.2 异步检查点算法
        2.2.3 同步检查点算法
    2.3 检查点性能
        2.3.1 评价检查点性能的指标
        2.3.2 改善检查点性能的策略
    2.4 本章小结
第3章 PDNS中单模拟节点容错的实现
    3.1 用户级非透明检查点
    3.2 Condor的用户级透明检查点机制
    3.3 基于Condor的NS-2 检查点实现
        3.3.1 使用Condor检查点库
        3.3.2 对NS-2 的修改
    3.4 实验分析
    3.5 本章小结
第4章 PDNS中 TCP连接的备份与恢复
    4.1 Linux 内核中套接字实现的分析
        4.1.1 Linux 套接字层
        4.1.2 Linux TCP 套接字通信过程分析
    4.2 TCP 套接字状态的获取
        4.2.1 TCP 连接套接字的状态
        4.2.2 TCP 监听套接字的状态
        4.2.3 接收与发送数据的状态
    4.3 PDNS 中TCP 连接的备份与恢复
        4.3.1 主要数据结构
        4.3.2 程序流程
    4.4 本章小结
第5章 PDNS 检查点容错系统
    5.1 PDNS 分布式检查点算法
        5.1.1 Sync-and-Stop 算法
        5.1.2 Chandy-Lamport 算法
        5.1.3 PDNS 检查点算法选择
    5.2 PDNS 检查点容错系统原型
        5.2.1 相关函数介绍
        5.2.2 PDNS 中SNS 算法的实现
        5.2.3 PDNS 检查点卷回恢复
        5.2.4 进一步的讨论
    5.3 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢



本文编号:3823165

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3823165.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ff7fd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]