|
|
(3 révisions intermédiaires par 2 utilisateurs non affichées) |
Ligne 46 : |
Ligne 46 : |
| La VM relance un système complet, avec un init [2] qui est pour l'OS virtuel son init de pid 1, à partir duquel sont lancés les processus spécifiques à la VM. Ces processus sont lancés sur la machine physique elle-même et donc visibles avec "ps -ef". | | La VM relance un système complet, avec un init [2] qui est pour l'OS virtuel son init de pid 1, à partir duquel sont lancés les processus spécifiques à la VM. Ces processus sont lancés sur la machine physique elle-même et donc visibles avec "ps -ef". |
| | | |
− | = Cluster =
| |
− | == Configuration ==
| |
− | Sur le maitre :
| |
− | pveca -c
| |
− | Génère des clés RSA pour les échanges entre serveurs, et déclare ce serveur comme master (il gèrera tous les autres noeuds et toutes les opérations standards, voir plus bas).
| |
− |
| |
− | Vérifier la configuration avec
| |
− | pveca -l
| |
− |
| |
− | Sur le(s) esclaves(s) :
| |
− | pveca -a -h 192.168.1.33
| |
− | (ou 192.168.1.33 est l'IP du maître)
| |
− |
| |
− | Vérifier que les deux noeuds se voient bien
| |
− | pveca -l
| |
− | RELANCER les 2 serveurs.
| |
− |
| |
− | == Suppression d'un noeud ==
| |
− | Sur le master :
| |
− | pveca -d <ID du noeud>
| |
− | Et sur l'esclave, resynchroniser la configuration à partir de celle du maître
| |
− | pveca -s 192.168.1.33
| |
− |
| |
− | == Migration de VMs ==
| |
− | La migration d'un VM locale (hébergée sur le disque local d'un noeud) doit se faire machine arrêtée (la migration "live" ne peut se faire que si le vdisk est stocké sur un espace partagé par les 2 noeuds concernées - voir plus bas "[[#drbd|DRBD]]".
| |
− |
| |
− | La migration "offline" est réalisée avec rsync (environ 3 mns pour un fichier qcow2 de 800M, sur un réseau 100Mb/s).
| |
− |
| |
− | == Erreurs possibles ==
| |
− | * Erreur "Ticket authentication failed - invalid ticket..." à la création d'un noeud esclave.
| |
− | ** Vérifier en premier lieu l'heure des serveurs.
| |
− | ** Si l'heure est identique, vérifier que les serveurs ont accès à un serveur DNS (le contraire peut ralentir les échanges ssh, et causer des timeouts).
| |
− | ** Si tout ça est bon, l'erreur peut disparaitre seul après quelques minutes, le temps que les serveurs se synchronisent. Se déconnecter et se reconnecter sur l'interface peut aussi aider.
| |
− |
| |
− | == Opérations sur le cluster ==
| |
− | ATTENTION : Les opération de démarrage/arrêt des VM, les consoles VNC, la soumission de jobs, ne peuvent être réalisés QU'A PARTIR DU MASTER. La gestion de tous les noeuds et de toutes les VMs doit se faire de ce serveur-ci.
| |
− |
| |
− | Sur un autre noeud, on obtient "Vous n'avez pas les droits d'accès en écriture." ("You do not have write access").
| |
− | Si le master est défaillant, ou pour utiliser ces fonctions à partir d'un autre noeud, il faut passer celui-ci en maître. Sur le noeud en question :
| |
− | pveca -m
| |
− |
| |
− | Et avertir éventuellement tous les autres noeuds du changement de maître. Sur chacun d'eux :
| |
− | pveca -s -h <IP du nouveau maître>
| |
− | leur fait découvrir le nouveau maître, mais ne les ré-enregistre pas automatiquement dessus. Pour ça relancer :
| |
− | pveca -a -h <IP du nouveau maître>
| |
− |
| |
− | == Visualisation des stockage ==
| |
− | On ne voit les disques locaux ("storage" de type "local") qu'en se connectant individuellement à l'interface de chacun des noeuds. Seuls les emplacements partagés sur le maître apparaissent sur les autres, mais attention aux pertes de VM à la migration si '''[[#bug_storage|<span style="color:red">ces emplacements n'existent pas sur un des noeuds !</span>]]'''
| |
− |
| |
− | -------------------
| |
− |
| |
− | == <span id="drbd">DRBD</span> ==
| |
− | N'est utile que pour migrer à chaud les VM full (KVM), car il sait migrer à chaud les VZ (penser à fermer les consoles VNC dans ce cas, sinon il ne peut pas suspendre la VM au moment de basculer sur l'autre serveur). La migration a froid est une copie disque à disque avec rsync, il n'y a donc pas besoin non plus de drbd.
| |
− |
| |
− | === Configuration ===
| |
− | Les 2 serveurs en cluster utilisés pour tester DRBD avec Proxmox n'ont qu'un disque (2*250Go en RAID1). Proxmox a partitionné / (pve-root) à 54Go et /var/lib/vz (pve-data) à 163 Go.
| |
− |
| |
− | ==== Réduction de la partition pve-data ====
| |
− | OPTIONNEL. Pour un premier test on réduit pve-data à 10G, on crée un pve-data2 sur la place libre et on le réplique en DRBD.
| |
− | /etc/init.d/pvedaemon stop
| |
− | umount /dev/mapper/pve-data
| |
− | e2fsck -f /dev/mapper/pve-data
| |
− | resize2fs -p /dev/mapper/pve-data -p 10G # la nouvelle taille devient 10 Go
| |
− | lvresize -L 11G /dev/mapper/pve-data # légèrement plus grand pour être sûr de ne rien couper sur le FS
| |
− | mount /var/lib/vz # On remonte pve-data
| |
− |
| |
− | vgdisplay # vérifiez l'espace disponible dans le volume LVM
| |
− | lvcreate -n data2 -L 158G pve # créer un emplacement data2 (NOTE : pas de "pve-" dans le nom, c'est le nom du VG ajouté automatiquement)
| |
− | /etc/init.d/pvedaemon start
| |
− |
| |
− | ==== Installation DRBD ====
| |
− | A partir de là, on a une partition LVM utilisable pour drbd. Voir http://wiki.systea.fr/index.php/R%C3%A9plication_de_syst%C3%A8mes_de_fichiers_avec_DRBD
| |
− |
| |
− | ==== Création d'un volume group répliqué ====
| |
− | Quand DRBD est opérationnel, il faut déclarer ce volume répliqué dans Proxmox. On ne peut pas utiliser ext3 sur le volume DRBD en primary/primary car il faut un filesystem qui fonctionne en cluster (pas d'erreurs si on formate en ext3, mais les modifications du filesystem ne sont tout simplement pas répliquées et pas vu sur les autres noeuds). On utilisera donc LVM, qu'on remet par-dessus DRBD, lui-même étant déjà par-dessus LVM...
| |
− |
| |
− | '''D'ABORD CREER UNE PARTITION LVM SUR LE DEVICE DRBD''' ! Avec fdisk, en donnant le type 8E (LVM). On a donc l'empilage suivant :
| |
− | Disque
| |
− | partition LVM (fdisk 8E)
| |
− | Groupe de volume
| |
− | Volume logique
| |
− | DRBD
| |
− | partition LVM
| |
− | Groupe de volume
| |
− | Les volumes logiques des VMs seront ensuite gérés par Proxmox.
| |
− |
| |
− | Vérifier si la partition apparait dans /dev/mapper (elle doit être nommée par défaut drbd0p1). Si ce n'est pas le cas, la déclarer avec kpartx
| |
− | kpartx -a /dev/drbd0
| |
− | Si kpartx n'est pas installé :
| |
− | apt-get install kpartx
| |
− | '''ATTENTION :''' LANCER KPARTX SUR LES '''2''' NOEUDS, SINON LE SECOND NE VERRA PAS LE NOUVEAU VOLUM GROUP !!
| |
− |
| |
− | Ensuite :
| |
− | pvcreate /dev/mapper/drbd0p1
| |
− | pvscan
| |
− | PV /dev/sda2 VG pve lvm2 [231.75 GB / 764.00 MB free]
| |
− | PV /dev/dm-4 lvm2 [157.99 GB]
| |
− | Total: 2 [389.73 GB] / in use: 1 [231.75 GB] / in no VG: 1 [157.99 GB]
| |
− | vgcreate drbdvg /dev/mapper/drbd0p1
| |
− | pvscan
| |
− | PV /dev/dm-4 VG drbdvg lvm2 [157.98 GB / 157.98 GB free]
| |
− | PV /dev/sda2 VG pve lvm2 [231.75 GB / 764.00 MB free]
| |
− | Total: 2 [389.73 GB] / in use: 2 [389.73 GB] / in no VG: 0 [0 ]
| |
− |
| |
− | Il reste à ajouter un storage de type "LVM" dans l'interface Proxmox, sur le VG "drbdvg", en "Partagé".
| |
− |
| |
− | '''IMPORTANT''': kpartx est nécessaire au reboot pour que la machine re-découvre bien la partition contenant drbd.
| |
− |
| |
− | Ajouter dans /etc/rc.local
| |
− | kpartx -a /dev/drbd0
| |
− |
| |
− | === Notes sur DRBD ===
| |
− | Limitation : on ne peut dans ce cas que créer des VM avec un disque raw (sur un volume logique créé pour l'occasion) dont plus question de diques extensibles type qcow2.
| |
− |
| |
− | '''<span style="color:red">NOTE IMPORTANTE :</span>'''<span id="bug_storage"> Si on ajoute d'autres noeuds au clusters et que ceux-ci ne font pas partie de la réplication DRBD, il y a risque de perte de VM. L'emplacement DRBD étant partagé sur le maître, ilo sera visible '''sur tous les noeuds''', même ceux qui ne l'ont pas. On peut donc par erreur migrer une VM de l'emplacement DRBD vers un noeud qui n'a pas cet emplacement : Proxmox ne l'interdit pas, mais la VM est perdue ! Elle fait 0 octet à l'arrivée, et impossible de la ramener vers le noeud de départ car il ne trouve plus le volume correspondant, et s'arrête en erreur !</span>
| |
− |
| |
− | '''Il est donc préférable''' de créer un cluster pour les noeuds partageant un emplacement de type DRBD (pour les migrations à chaud), et un autre cluster pour les noeuds n'ayant que des emplacements locaux. Ce second cluster permettra de centraliser la gestion de ces machines et autorisera des migrations "à froid" d'emplacement local vers emplacement local.
| |
− |
| |
− | === Erreur SPLIT BRAIN ===
| |
− | En cas de coupure du lien, un reboot d'un des noeuds, ou toute autre raison désynchronisant le DRBD, le primary/primary cause une erreur SPLIT BRAIN (en d'autres termes, il n'arrive plus à décider qui doit répliquer sur qui pour re-synchroniser les volumes).
| |
− |
| |
− | On peut voir dans les logs, par exemple :
| |
− | kernel: block drbd0: helper command: /sbin/drbdadm split-brain minor-0 exit code 0 (0x0)
| |
− |
| |
− | Si on essaie de passer DRBD sur le noeud esclave en secondaire, on a :
| |
− | drbdadm secondary all
| |
− | 0: State change failed: (-12) Device is held open by someone
| |
− | Command 'drbdsetup 0 secondary' terminated with exit code 11
| |
− |
| |
− | Pour relancer la réplication :
| |
− | Sur les 2 noeuds :
| |
− | drbdadm disconnect data2
| |
− |
| |
− | Sur le secondaire :
| |
− | vgchange -an drbdvg
| |
− | kpartx -d /dev/drbd0
| |
− | drbdadm secondary data2
| |
− | drbdadm -- --discard-my-data connect data2
| |
− | /proc/drbd doit indiquer une tentative de connexion au primaire "cs:WFConnection"
| |
− |
| |
− | Sur le primaire :
| |
− | drbdadm connect data2
| |
− | /proc/drbd doit indiquer un état "cs:Connected" sur les 2
| |
− |
| |
− | Vérifier la synchronisation :
| |
− | cat /proc/drbd
| |
− | Lorsque c'est UpToDate/UpToDate, sur le secondaire :
| |
− | drbdadm primary data2
| |
− | kpartx -a /dev/drbd0
| |
− | vgchange -ay drbdvg
| |
− | Pour valider la synchronisation des volumes :
| |
− | drbdadm verify data2
| |
− | watch cat /proc/drbd
| |
| | | |
| = TIPS = | | = TIPS = |
Ligne 287 : |
Ligne 134 : |
| dd if=vm-103-disk-1.raw of=/dev/drbdvg/vm-101-disk-1 | | dd if=vm-103-disk-1.raw of=/dev/drbdvg/vm-101-disk-1 |
| | | |
− | = Migration VMware -> KVM = | + | = Gestion en ligne de commande = |
− | La transformation varie selon que la VM KVM de destination fonctionne en fichier qcow2 ou dans un volume logique (utile pour le cluster avec LVM).
| + | L'outils '''qm''' permet de gérer les machines virtuelles en ligne de commande. "qm help" est la première chose à faire ! |
− | | + | * Liste les VMs |
− | * Migration en fichier qcow2 | + | qm list |
− | qemu-img convert -O qcow2 VM_vmware.vmdk VM_kvm.qcow2 | + | * Gestion de l'état |
− | * Transfert dans un volume logique | + | qm start <vmid> |
− | Créer la machine virtuelle par l'interface (attention à la taille disque qui doit correspondre à la taille de la VM d'origine ! On peut la voir après conversion en raw, le fichier aura la taille exacte finale), de façon à ce que le volume logique existe. Puis :
| + | qm stop <vmid> |
− | dd if=VM_vmware.vmdk of=/dev/pve/vm-102-disk-1 | + | qm reset <vmid> |
− | | + | * Gestion des VMs |
− | '''NOTE''' : si la VM ne démarre pas ensuite (que ce soit en qcow2 ou en LVM, message "booting from hard disk...boot failed: not a bootable disk"), changer le disque vmdk en "preallocated". Le mode "single growable" (dynamique) est incompatible avec ces migrations.
| + | qm [create|set] <vmid> [voir l'aide pour la liste des paramètres à créer/modifier] |
− | Sur une machine vmware (Server ou ESX) modifier le fichier avec
| + | qm status <vmid> |
− | vmware-vdiskmanager -r VM_vmware.vmdk -t 2 VM_vmware-pa.vmdk | + | qm destroy <vmid> |
− | Et retenter la conversion en qcow2 ou la copie vers le volume logique.
| + | * VNC |
| + | qm vncproxy <vmid> <ticket> |
Installation de Proxmox VE 1.7 à partir de l'ISO.
L'ISO est une debian version 5.0.7 (lenny) minimum avec les paquets PVE. Le noyau installé est en 64bits.
L'installateur crée automatiquement un bridge vmbr0 vers l'interface eth0.
Partitionnement sur un RAID1 232G (automatique, pas moyen de le modifier au cours de l'install)
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/pve-root 58G 1.1G 54G 3% / ---> 54G un peu excessif ?
tmpfs 2.0G 0 2.0G 0% /lib/init/rw
udev 10M 616K 9.4M 7% /dev
tmpfs 2.0G 0 2.0G 0% /dev/shm
/dev/mapper/pve-data 164G 601M 163G 1% /var/lib/vz
/dev/sda1 504M 31M 448M 7% /boot
A la fin de l'install, connexion à l'interface par http://192.168.37.110 --> renvoie vers https.
login root/<mot_de_passe donné à l'installation>
Passer tout de suite l'interface en français (Menu System/ onglet Options)
Le réseau de l'hôte est manageable par l'interface. Même le bonding est reconnu et peut être configuré (mode, etc...) (création par l'icone à côté du titre "configuration de l'interface").
Par contre, pour une interface eth2 non configurée au départ, j'ai du ajouter la gateway à la main, il ne proposait pas le champ. Mais une fois ajoutée manuellement dans le fichier /etc/network/interfaces et le réseau redémarré, il l'affiche bien dans le GUI et le champ apparait dans la config de eth2.
Note : Quand on modifie le réseau par le GUI il créé un "interfaces.new" qui est pris en compte au prochain redémarrage. Il suffit de modifier ce fichier juste avant de redémarrer pour que ce soit pris en compte (ajout de la gateway, par exemple).
Utilisation
Création VM full (KVM)
Téléchargement des isos pour l'installation des machines virtuelles par l'interface. ça tombe dans /var/lib/vz/template/iso/.
Création des VMs par l'interface, pas de problème, c'est intuitif. On indique l'iso d'installation comme "CD de démarrage".
La VM est bien lancée avec /usr/bin/kvm (pas de qemu sur Debian).
OpenVZ
Pour les appliances openVZ, on peut uploader d'un poste ou choisir dans la liste des appliances disponibles directement chez Proxmox.
Mais apparement elles n'y sont pas toutes. On en a un plus grand choix ici : http://pve.proxmox.com/wiki/Get_Virtual_Appliances
(notamment une BlueOnyx !)
Test OpenVZ est avec une image debian6. Il faut paramétrer le réseau manuellement, mais sinon tout fonctionne. On peut paramétrer en venet (non-bridge) avec une adresse sur le sous-réseau quand même, la VM est bien accessible par son adresse dédiée (=> à priori pas besoin de bridge ici, donc pourquoi proposer l'option ?)
La VM relance un système complet, avec un init [2] qui est pour l'OS virtuel son init de pid 1, à partir duquel sont lancés les processus spécifiques à la VM. Ces processus sont lancés sur la machine physique elle-même et donc visibles avec "ps -ef".
TIPS
- En cas d'erreur dans le choix du stockage (ex. choix de LVM au lieu de Directory), pour enlever une référence à un "storage" qu'on ne pourrait pas enlever par l'UI, on peut éditer /etc/pve/storage.cfg sur tous les noeuds, puis relancer pvedaemon.
Installation manuelle de Proxmox
L'installation est recommandée sur Lenny. Ici problème : le Dell R610 refuse de booter sur un CD Lenny, on teste donc sur une Squeeze, et ça marche !
Installation sur Squeeze 64 bits (Partitionnement LVM, une partition / de 10 Go, et le reste pour /var/lib/vz) de base (juste serveur SSH).
Quelques réglages réseau utiles à la fin de l'installation de Debian :
vi /etc/sysctl.conf
net.ipv4.conf.all.rp_filter=1
net.ipv4.icmp_echo_ignore_broadcasts=1
net.ipv4.conf.default.forwarding=1
net.ipv4.conf.default.proxy_arp = 0
net.ipv4.ip_forward=1
kernel.sysrq = 1
net.ipv4.conf.default.send_redirects = 1
net.ipv4.conf.all.send_redirects = 0
net.ipv4.conf.eth0.proxy_arp=1
Eventuellement ajouter "avec précaution" :
#optimiser en cas d'attaque
net.ipv4.conf.all.log_martians = 1
net.ipv4.conf.default.log_martians = 1
net.ipv4.tcp_max_syn_backlog = 2048
net.ipv4.tcp_synack_retries = 3
net.ipv4.tcp_syn_retries = 2
Appliquer les changements
sysctl -p
Modifier le sources.list :
vi /etc/apt/sources.list
# PVE packages provided by proxmox.com
deb http://download.proxmox.com/debian lenny pve
Charger la clé Proxmox et mettre à jour APT
wget -O- "http://download.proxmox.com/debian/key.asc" | apt-key add -
apt-get update
Installer le noyau proxmox
aptitude install pve-kernel-2.6.32-4-pve
Les dépendance installent Grub, mais sur Squeeze c'est Grub 2 ! Il faut donc enregistrer le nouveau kernel :
update-grub
Afficher le fichier /boot/grub/grub.cfg généré pour repérer la place du noyau pve, et changer le noyau par défaut dans /etc/default/grub (rien que ça !!)
vi /etc/default/grub
GRUB_DEFAULT=2
Et enfin re-re-générer grub.cfg
update-grub
OK! On peut rebooter, puis vérifier que le noyau PVE a été chargé
uname -a
Linux 2.6.32-4-pve ...
Vérifier que les interfaces réseau n'ont pas changé de nom dans la bataille
ifconfig eth0
Si un message d'erreur "No device found" apparait, éditer le fichier /etc/udev/rules.d/70-persistent-net.rules et modifier les noms des interfaces.
Installer les paquets Proxmox VE et quelques dépendances
apt-get install postfix
aptitude install proxmox-ve-2.6.32 ntp ssh
Sur un DELL R610 avec des cartes réseau Broadcom, le paquet pve-firmware a refusé de s'installer car il voulait remplacer le firmware bnx2 déjà présent sur le système et utilisé. Il a fallu forcer la désinstallation de ce dernier avant de terminer l'installation
dpkg -r firmware-bnx2
apt-get -f install
Rebooter, et vérifier que les processus pve ont bien été lancés.
On peut maintenant se connecter à l'interface web et configurer vmbr0 (le bridge pour les VMs) dans System Configuration / Network : mettre l'adresse IP de eth0, cocher autostart et indiquer "eth0" comme bridge ports".
Rebooter une dernière fois.
Conversion de disque virtuel - transfert qcow2 -> LVM
Conversion
Pour convertir un fichier disque virtuel utiliser qemu-img.
qemu-img convert -O qcow2 vm-103-disk-1.raw vm-103-disk-1.qcow2
convertir un disque raw en disque qcow2 (taille dynamique).
Transfert fichier -> LVM
Exemple : si on décide de transférer une image qcow2 vers un volume logique LVM, créer une VM avec disque LVM de la même taille et avec les mêmes périphériques' ! (attention notamment au type de disque !). Puis transférer le fichier avec dd :
dd if=vm-103-disk-1.qcow2 of=/dev/drbdvg/vm-101-disk-1
Si la copie ne fonctionnera pas (disque non bootable à l'arrivée), transformer d'abord en disque non dynamique (raw) :
qemu-img convert -O raw vm-103-disk-1.qcow2 vm-103-disk-1.raw
dd if=vm-103-disk-1.raw of=/dev/drbdvg/vm-101-disk-1
Gestion en ligne de commande
L'outils qm permet de gérer les machines virtuelles en ligne de commande. "qm help" est la première chose à faire !
qm list
qm start <vmid>
qm stop <vmid>
qm reset <vmid>
qm [create|set] <vmid> [voir l'aide pour la liste des paramètres à créer/modifier]
qm status <vmid>
qm destroy <vmid>
qm vncproxy <vmid> <ticket>