openstack项目中遇到的各种问题总结 其四(迁移实验)

2019-07-14 03:00发布

五、实验

 

5.1、迁移实验

 冷迁移实验 1)、暂停云主机 2)、ssh登录YUN-12主机# cd /var/lib/nova/instances# scp -rp dbaab72b-75c3-4dc5-99f2-95a579a315c5 root@test -compute:/var/lib/nova/instances 3)、ssh登录YUN-11主机修改数据库# mysqluse nova;update instances set host='YUN-12' where hostname='test1' 4)、结果验证此刻可以看见云主机所属主机发生变化,变为test-computedashboard中选中test1“回复云主机”,结果“状态”、“任务”和“电源状态”分别是“Paused”、“None”和“No state 另外一次的冷迁移实验1)、YUN-19 # mysql mysql> use nova; mysql> update instances set host='YUN-20' where hostname='test1';  # scp -r a8814340-98d5-4ed3-b99b-32ee38cfb78f/ root@192.168.0.20:/var/lib/nova/instances/2)、YUN-20 2.1)、[root@YUN-20 instances]# lltotal 20drwxr-xr-x. 2 nova nova 4096 Apr 28 20:55 1c11a4b1-5df8-48f8-be5d-6e1c5efb7f99drwxr-xr-x. 2 root root 4096 Apr 28 21:41 a8814340-98d5-4ed3-b99b-32ee38cfb78fdrwxr-xr-x. 2 nova nova 4096 Apr 28 20:55 _base-rw-r--r--. 1 nova nova   29 Apr 28 21:28 compute_nodesdrwxr-xr-x. 2 nova nova 4096 Apr 23 23:49 locks [root@YUN-20 instances]# chown -R nova:nova a8814340-98d5-4ed3-b99b-32ee38cfb78f/ [root@YUN-20 instances]# lltotal 20drwxr-xr-x. 2 nova nova 4096 Apr 28 20:55 1c11a4b1-5df8-48f8-be5d-6e1c5efb7f99drwxr-xr-x. 2 nova nova 4096 Apr 28 21:41 a8814340-98d5-4ed3-b99b-32ee38cfb78fdrwxr-xr-x. 2 nova nova 4096 Apr 28 20:55 _base-rw-r--r--. 1 nova nova   29 Apr 28 21:28 compute_nodesdrwxr-xr-x. 2 nova nova 4096 Apr 23 23:49 locks 2.2)、网桥# brctl addbr br0# brctl add if br0 eth2 注:eth2 192.168.0.20 结果 网络无法连通 做下面的操作# brctl delbr br0 重启网络后主机连通 注:brctl命令 brctl show  查看网桥 [root@YUN-20 a8814340-98d5-4ed3-b99b-32ee38cfb78f]# virsh define libvirt.xmlDomain instance-00000001 defined from libvirt.xml [root@YUN-20 a8814340-98d5-4ed3-b99b-32ee38cfb78f]# virsh start instance-00000001error: Failed to start domain instance-00000001error: Cannot get interface MTU on 'qbr95221104-b9': No such device [root@YUN-20 a8814340-98d5-4ed3-b99b-32ee38cfb78f]# brctl addbr qbr95221104-b9[root@YUN-20 a8814340-98d5-4ed3-b99b-32ee38cfb78f]# brctl showbridge name bridge id  STP enabled interfacesqbr482b0524-26  8000.ea9b0ced7d50 no  qvb482b0524-26tap482b0524-26qbr95221104-b9  8000.000000000000 no  show  8000.000000000000 no  virbr0  8000.525400d2ae89 yes  virbr0-nic [root@YUN-20 a8814340-98d5-4ed3-b99b-32ee38cfb78f]# virsh define libvirt.xmlDomain instance-00000001 defined from libvirt.xml [root@YUN-20 a8814340-98d5-4ed3-b99b-32ee38cfb78f]# virsh start instance-00000001Domain instance-00000001 started 2.3)、启动发现云主机启动成功,但是其他机器无法PING通这台机器 进入控制台,发现无法进入系统,出现下面所示的错误BIOS EDD facility 0 devices foundEDD information not availableFreeing unused kernel memory:900k freed 2.4)、发现YUN-19上还存在在YUN-20上创建的网桥 [root@YUN-19 ~(keystone_admin)]# brctl showbridge name bridge id  STP enabled interfacesqbr7a2e6ef4-55  8000.1e1edf473784 no  qvb7a2e6ef4-55tap7a2e6ef4-55qbr95221104-b9  8000.325dbda87640 no  qvb95221104-b9qbra1cf60e8-36  8000.16f46f1ed7f8 no  qvba1cf60e8-36tapa1cf60e8-36show  8000.000000000000 no 删除不了,因为正在使用[root@YUN-19 ~(keystone_admin)]# brctl delbr qbr95221104-b9bridge qbr95221104-b9 is still up; can't delete it 关闭网桥# ifconfig qbr95221104-b9 down 再次删除[root@YUN-19 ~(keystone_admin)]# brctl delbr qbr95221104-b9 2.5)、关闭实例,重启系统 启动之后,启动实例,发现还是无法进入系统,错误相同 2.6)、解决问题[root@YUN-20 ~]# ifconfig qbr95221104-b9 down[root@YUN-20 ~]# brctl delbr qbr95221104-b9[root@YUN-20 ~]# brctl showbridge name bridge id  STP enabled interfacesqbr482b0524-26  8000.1ec880fdff13 no  qvb482b0524-26tap482b0524-26virbr0  8000.525400d2ae89 yes  virbr0-nic[root@YUN-20 ~]# brctl addbr qbr95221104-b9[root@YUN-20 ~]# brctl showbridge name bridge id  STP enabled interfacesqbr482b0524-26  8000.1ec880fdff13 no  qvb482b0524-26tap482b0524-26qbr95221104-b9  8000.000000000000 no  virbr0  8000.525400d2ae89 yes  virbr0-nic 2.7)、云主机ssh连不上在控制节点进入控制台,发现屏幕背景是黑 {MOD}的,在有下面出现一个弹窗提示The configuration defaults for GNOME Power Manager have not been installed correctly.Please contact your computertor”。 再次重启进入桌面,进入命令行界面,查看系统空间信息,发现根下面被完全占用。 解决办法:网上的解决办法:1、On login Screen,press Control+Alt+F22、Remove same files or folders3、Check the permissiions on your /tmp folder or just set them to: sudo chmod 0777 /tmp4、Execute the command: reboot但是执行完上边的操作后,ssh还是连不上系统。 执行下面的操作yum remove and re-install gnome-power-manager reboot 之后发现系统可以通过SSH连接主机正常 2.8)、确定镜像文件在拷贝到远程的主机之前是否需要转换一下格式YUN-11所在的集群实例迁移到YUN-19所在集群 YUN-17上的实例做实验 cirros的镜像创建的实例为例直接把实例目录下的disk文件拷贝到远程主机上然后添加镜像,镜像格式化为qcow2之后再dash中从该镜像启动实例,结果失败,状态为“Error 在拷贝disk文件之前把镜像各是转换为qcow格式拷贝后添加镜像,格式化为qcow2之后再dash中从该镜像启动实例,结果启动成功,但是在随后绑定浮动IP后,结果在外部的机器无法PING通该实例的浮动IP YUN-11所在的集群内做迁移 直接把实例目录下的disk文件拷贝到远程主机上然后添加镜像,镜像格式化为qcow2之后再dash中从该镜像启动实例,结果失败,状态为“Error 把上面转换为qcow格式的镜像拷贝到YUN-11上,在做之后的操作,最后发现外部主机可以PING通浮动IP 从这可以看出是YUN-19所在集群网络的问题,因为这两个集群网路相同YUN-19集群dash中创建实例,在YUN-11所在的集群上的实例无法pingYUN-19所在集群上实例的内网IP,绑定浮动IP后也无法PING 事实证明的确需要装换镜像格式   

六、问题

6.1、创建网桥和扩展计算节点的先后顺序颠倒之后会不会产生意外的后果?我在日常的部署中两个顺序在颠倒的情况下暂时没有发现意外的后果,有待测试