云计算国产化之路 vnc登录 文件系统直通(virtio-9p) 扩展qemu接口 gpg WARNING 珍藏博客 虚拟内存情况dommemstat分析 免密码自动登录脚本 Linux网桥 测试网段IP占用情况 Linux 进程状态 systemc强制依赖 调试openstack ut uefi p2v 重做ubuntu内核 virsh创建虚拟机简介 virtio IO路径 虚拟化层升级后磁盘无法卸载卷 vmtouch使用 Taint flags 主机和虚拟机文件共享处理的几种方法 kvm分析工具 kvm中对磁盘的io cache 虚拟化不同导致的guestos中软件安装差异(未解决) 设备直通(PCI Assignment)到底是咋整的 virtio到底是咋整的 内核启动参数 虚拟化实时性提升(零)之配置步骤 中断虚拟化(pic)到底是咋整的 中断虚拟化(apic)到底是咋整的 Raid卡配置丢失导致服务器无法启动 tainted kernels cpu stuck for 23s问题分析 虚拟化实时性提升(一)之hostOS切换为强实时系统 内存虚拟化到底是咋整的 qemu-kvm中vcpu虚拟化到底是咋整的 风河虚拟化技术点分析 使用qga的好处 qemu迁移代码分析 虚拟机串口配置及其导出到主机pts和console.log System-based I/O vs. Raw I/O 虚拟机使用Hugepage(大页) 硬件辅助分页(hardware assisted paging) 修改centos7默认启动项目 virtio的工作流程——kernel中virtio-pci初始化(2) virtio的工作流程——qemu中virtio-backend初始化(1) qmp ceilometer取不到memory.usage指标 Virtio-Balloon超详细分析 slabtop输出 虚拟机磁盘cache导致的host os kernel崩溃 虚拟机cpu和memory性能优化测评 PCI配置空间(PCI Configuration Space) centos下网卡设备直通(VT-dpci passthrough)遇到的问题及其解决思路 libguestfs详解 yum卸载软件包及其依赖 通过原始Centos ISO来定制自己的ISO centos下网卡设备直通(VT-d,pci passthrough) (占位符)window虚拟机中拔盘如何通知到libvirt和qemu后端的 cirrus漏洞分析CVE-2017-2615 XSA-208 qcow2随笔 控制寄存器概览 ceilometer对接postgresql 解压initrd和vmlinuz qemu guest agent验证 QEMU升级指南(待续) ubuntu中kdump的配置 qemu(2.3)接口梳理 热迁移导致的FC存储场景下的multipath卷残留问题分析 virsh命令(4)secret,snapshot,pool,volume部分 virsh命令(3)之interface,filter,network virsh命令(2)monitor,host,nodedev部分 virsh命令(1)之domain部分 QEMU内存管理之FlatView模型(QEMU2.0.0) ovirt基于sanock的高可用(主机粒度HA) Sanlock防脑裂场景功能测试用例 gnocchi配置及与ceilometer对接指南 make patch for libvirt in centos centos使用sanlock指导 高可用nfs资料 ubuntu14中使用sanlock指导 LVM操作指南 sanlock相关功能验证流程汇总 make patch for libvirt in ubuntu libvirt.so.0-version `LIBVIRT_PRIVATE_1.2.7' not found gdb debug libvirt 基于ubuntu社区源码包编译libvirt compile libvirt(centos) No PCI buses available nfs lead to Linux halt nfs install and config anti-virus for cloud platform nova fetch image from glance(something about _base) token auth process ovs入门指南 virt software anti-virus something about ceilometer disk sample context interview questions openstack vm injection openstack Restful and RPC murano 概览 创建虚拟机流程(compute节点)之网络创建 创建虚拟机流程之compute_api之虚拟机实例填充之配额检测 创建虚拟机流程之compute_api之基本参数生成 创建虚拟机流程之compute_api 创建虚拟机流程(主) 创建虚拟机之image 创建虚拟机流程之准备网桥 创建虚拟机流程之virt 创建虚拟机流程之compute节点 CI/CD研发流程之工程创建 CI/CD研发流程之代码合入 CI/CD研发流程之UT(单元测试) 向openstack社区合入代码记 openstack/ceilometer/gnocchi杂谈 影子页表原理 mem_add(exec.c) qemu编译安装调试 openstack/ceilometer/gnocchi之Grafana简介 openstack wiki etcd openstack计量ceilometer openstack计费cloudKitty enventlet backdoor USB 安装VMWARE ESX pycharm设置指南 无法执行modprobe -a kvm-intel解决办法 QEMU配置项 网络不通小记 libvirt之XML(虚拟机定义文件) openstack-horizon 证书认证 ceilometer与ceph对接 openstack定时任务剖析(TODO) 服务器重启后mongodb进程无法启动 ubuntu14下新增openstack服务到service的导引 ERROR 1045(28000)-数据库连不上 Python两个内置函数—locals和globals unknown exit, hardware reason 31

vm resize/revert/cold migration bug

2016年01月03日

背景

在Kilo版本发现此问题,经验证Liberty此问题依然存在 此外需要注意,是从镜像启动的虚拟机。

目标已提交bug:https://bugs.launchpad.net/nova/+bug/1549194

问题描述

对一台虚拟机testVM,执行resize操作
(resize的实质用一个新的flavor去构建一个新的虚拟机,默认情况下,新创建的虚拟会在另外一台计算节点上。另外,openstack要求resize的flavor只能规格更大)

revert刚刚的resize操作 默认情况下,resize执行完了,需要用户去确认操作。确认完后会清理掉一些缓存的东西,类似于数据库的commit操作。 当然,也可以取消刚刚的resize操作,也就是revert resize,虚拟机的相关东西会回滚至执行resize之前。

对虚拟机testVM执行冷迁移 对openstack熟悉的同学会知道,冷迁移和resize实际走的是一套流程。 执行这个操作会失败,此后虚拟机会进入error状态。*

问题定位

conductor接受到请求后会选出一个计算节点作为目标节点,默认配置下会是另外一个计算节点。 然后向目标节点发送请求,让其开始准备迁移。 目标节点接受到请求后,准备必须的资源,然后向源节点(虚拟机原来在的节点)发送请求,让其开始迁移。

源节点接受到请求后,执行迁移操作,最后向目标节点发送请求finish_resize,让其结束此次迁移 目标节点接受到请求后,会新起个虚拟机进程,网络存储什么的该绑上的绑上。这里需要注意标红的地方。

_create_image方法中,有这么一段,翻译一下就是,当传入的size大于克隆盘容量大小时,扩容。 具体点说就是,resize的时候更大的那个flavor的系统盘大小就是传入的size来源。

刚说过,执行冷迁移会是一套代码。 冷迁移还是会走到刚刚的_create_image,不过这里我们关注verify_base_size,它会判断大小。 根据刚刚的操作步骤,执行冷迁移前,我们已经revert了resize,也就是说当前虚拟机的规格是小的。 但是,上面变大的镜像拷贝没有变小,导致这里校验出错。

问题修改

revert resize后缩容 就是执行revert resize后,将克隆盘减小回原来的大小 目前已验证,ceph可以变小,变小后,虚拟机正常 优点:符合整体的逻辑,可以解决bug 缺点:1.与openstacck只增大不缩小的思路悖逆。 2.rbd是瘦分配,支持缩小,其他不支持类型如何统一。 confirm resize的时候再扩容 用户执行确认执行resize后进行容量的调整。 优点:可以解决问题,不牵扯缩容的问题缺点:1.resize整体的逻辑变化较大

目前这问题在社区滞留。