Quantcast
Channel: VMware Communities: Message List
Viewing all articles
Browse latest Browse all 169668

Come ovviare/mitigare un problema di una nic che "ammutolisce" ma col link che resta attivo

$
0
0

Ciao, stamattina sono stato svegliato per un problema su un cluster, dove le VM su un host non erano più raggiungibili, e non si potevano migrare su altri host.

La causa era una nic fisica che appariva "up" ma che evidentemente non comunicava più. Cliccando sulla "i" che nell'interfaccia web si vede accanto alla nic le informazioni CDP erano assenti. Invertendo l'ordine active/standby con un'altra nic la connettività era ripristinata.

Sullo switch non c'erano errori ethernet sulla porta, lo stp non è abilitato, mettendola in down dallo switch e rialzandola nulla cambiava (e il link veniva ripristinato). C'è qualche log di ESXi che mi potrebbe dare informazioni utili per capire cosa sia accaduto?

 

Riassumo la configurazione del cluster: 4 host dell (3 710hd e un 520) con 4 nic (2 embedded + 2 sulla mezzanina). Datastore solo NFS.

Ogni host ha 2 vSwitch ognuno dei quali ha 2 nic fisiche. Il vSwitch0 ha la management e la vmotion, il vSwitch2 ha le reti di produzione e l'NFS. Una vmnic è attiva per l'nfs e standby per l'altro traffico, e viceversa.

Gli host sono connessi a uno switch formato da 4 moduli in stacking.

 

L'host con il guaio (il 520, attivo da 3 settimane) ha il vSwitch0 (management e vmotion) legato alle 'mezzanine' e vSwitch2 legato alle embedded. una di queste due ha "tradito".

Le schede sono entrambe broacdom (5719 e 5720): i fw delle schede e i driver usati da ESXi appaiono gli stessi (ESXi preinstallato quindi ha l'immagine Dell)

In questa configurazione (non ideale, lo so) credo di non poter usare il Beaconing per il rilevamento dei failure perché i link sono solo 2, giusto?

 

L'host è stato riavviato, sfilato e reinfilato e tutto sembra regolare. Ora ho impostato entrambe le vmnic in Active: in questo caso cosa accadrebbe se la vmnic dispettosa tornasse a guastarsi? Avrei ugualmente interruzione delle connessioni esistenti, o l'hypervisor rediziona il traffico sull'altra nic?

 

grazie...


Viewing all articles
Browse latest Browse all 169668

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>