阿里云虚拟化热升级技术的直通设备移交是什么?-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

阿里云虚拟化热升级技术的直通设备移交是什么?

来自:电子工业出版社 2021-11-26 15:30:23 306 1

阿里云虚拟化热升级技术的直通设备移交是什么?

取消 提交回答
全部回答(1)
  • 今晚就远航
    2021-11-26 17:13:36

    2000元阿里云代金券免费领取,2核4G云服务器仅689元/3年,新老用户都有优惠,立即抢购>>>

    大型的云服务提供商有不少的计算服务通过将GPU 或FPGA 设备直通给虚拟机,来加速用户的诸如深度学习、人工智能相关的应用程序。使用Intel VT-d 技术实现设备直通,可让虚拟机直接访问硬件设备。现代设备的访问都是由DMA(直接内存访问)来完成的,在虚拟化直通设备的情况下,DMA 访问所需的从GPA(虚拟机物理地址)到HPA(物理机物理地址)的转化,是由IOMMU 来实现的。如果实现带有直通设备的虚拟机的热升级,那么需要迁移设备的内部状态,重建IOMMU 重映射表,保存和恢复正在进行的DMA 操作以免造成数据丢失。这是比较复杂的情况, 而且没有现成框架可以使用。

    在阿里云虚拟化热升级技术中,我们使用了“直通设备移交”的方式来实现直通设备的热升级。由于我们都是使用VFIO 这个框架来实现设备直通的,VFIO 会在/ dev/vfio/ 目录下暴露一些设备节点给QEMU 使用。在热升级框架中,引入了一个用户态的VFIO 连接器,它将所有与VFIO 相关的文件描述符和接口(包括/dev/vfio、/ dev/vfio/grp*、 VFIO eventfd 和KVM irqfd 等),以及QEMU 对VFIO 文件描述符的访问包装起来,如下图所示。

    在热升级的过程中,只需要将VFIO 连接器的控制权移交给升级后的QEMU 进程即可,避免了设备状态的保存和IOMMU 重映射表的重建等非常复杂的操作。在热升级框架的设计中,我们通过在设备移交后立刻给虚拟机注入一个虚拟中断的方式,解决了中断丢失的问题。

    在一些典型的测试案例( 如空载、Web 服务器、MySQL 数据库服务器、SPECCPU 压测等)中,阿里云虚拟机热升级带来的业务中断时间为30 毫秒左右。该热升级框架在线上大规模虚拟机的功能迭代、运维升级中发挥了巨大的作用,已经成为阿里云弹性计算升级迭代的运维利器,也是阿里云虚拟化的核心技术之一。

    image.png

    资料来源:《弹性计算—无处不在的算力》

    0 0
相关问答

1

回答

【漏洞公告】微软“周二补丁日”—2018年05月

正禾 2018-05-10 14:57:30 34548浏览量 回答数 1

6

回答

在Windows 2012系统上安装VMware Player虚拟Windows XP机子

dongshan8 2015-09-29 20:51:32 31904浏览量 回答数 6

5

回答

阿里云与Linode对比测试-阿里云与Linode选哪个好

roye888 2013-10-22 11:39:01 27291浏览量 回答数 5

15

回答

为啥要用阿里云主机而不用虚拟主机

sunfei 2013-07-30 21:44:32 37853浏览量 回答数 15

43

回答

什么是云主机,云服务器与vps有什么区别?

zhuangdengyun 2011-11-01 04:21:50 49886浏览量 回答数 43

33

回答

西部数码云主机根本与阿里云不是一个层次

olloewsse 2012-10-03 22:59:12 31859浏览量 回答数 33

26

回答

在阿里云ECS里安装Windows 7 32位中文版

dongshan8 2016-02-29 17:42:48 48295浏览量 回答数 26

17

回答

游戏云间之三:游戏运维

起航 2014-03-13 10:31:45 25785浏览量 回答数 17

39

回答

【云服务器分享】简述云服务器对比VPS

dreamdoo 2012-10-08 16:24:18 120234浏览量 回答数 39

20

回答

阿里云为什么不能修改硬盘容量

云代维 2014-03-14 21:46:31 27880浏览量 回答数 20
0
文章
711
问答
问答排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载
http://www.vxiaotou.com