1 line
4.5 KiB
JSON
1 line
4.5 KiB
JSON
{"uuid":"8da6da4b-5b28-4f67-b6f7-277ee42843ce","slug":"de-zigbee2mqtt-a-proxmox-l-effet-papillon-d-un-switch-defaillant","title":"De Zigbee2MQTT à Proxmox : l’effet papillon d’un switch défaillant","author":"cedric@abonnel.fr","published":true,"published_at":"2025-05-25 06:01:36","created_at":"2025-05-25 06:01:36","updated_at":"2025-05-25 06:01:36","revisions":[],"cover":"","category":"domotique","content":"# De Zigbee2MQTT à Proxmox : l’effet papillon d’un switch défaillant\n\n## Contexte initial\n\nDepuis plusieurs semaines, je soupçonnais mon coordinateur Zigbee *SLZB-06M* (Ethernet + PoE) de provoquer des instabilités réseau sous Zigbee2MQTT. Les symptômes étaient clairs : redémarrages en boucle du service, erreurs `ECONNRESET`, commandes Zigbee échouées… Bref, une stack Zigbee instable malgré une configuration soignée.\n\nJ’avais tout envisagé : firmware Ember instable, problème d’alimentation PoE, bugs dans le bridge UART-to-TCP, saturation du port TCP 6638. J’ai même reflashé le dongle et validé la configuration YAML ligne par ligne. Sans succès. Toujours les mêmes erreurs :\n\n```\nerror: zh:ember: Adapter fatal error: ERROR_SERIAL_INIT\nerror: zh:ember:uart:ash: Port Error: read ECONNRESET\n```\n\nJ’envisageais déjà de tout remplacer : passer à un dongle USB, revoir le routage, refaire un mesh propre. Et puis...\n\n---\n\n## L’incident du lundi matin\n\nUn blackout complet frappe mon infra : plus aucun service local ou distant ne répond. Proxmox, Zigbee2MQTT, partages NFS, Home Assistant, NAS — tout semble mort. Même l’accès Internet est intact, mais tout ce qui repose sur mon réseau interne est figé.\n\nJ’isole alors le NAS (la machine hôte centrale qui héberge tout le stockage via Proxmox), le connecte localement via un boîtier d’acquisition HDMI. Rien. Écran noir.\n\nJe commence à douter de tout : le câble DisplayPort ? Le boîtier HDMI ? Le BIOS ? Je teste, redémarre, écoute. Trois bips longs. Rien à l’écran. Jusqu’à ce que je réalise que j’attendais une image 1080p… alors que le BIOS sort du 640x480. Je reconfigure OBS (oui, parce que je passe par OBS pour afficher mes périphériques), ajuste la fréquence… et là, miracle :\n\n> « Press to enter Setup or to enter Boot Menu »\n\nS’ensuivent des erreurs BIOS typiques :\n\n```\nERROR - POST - Invalid date / time\nERROR - POST - Bad RTC Battery\nBIOS Settings defaults loaded.\n```\n\n---\n\n## Le coupable n°1 : la pile CMOS\n\nLa pile bouton est morte. Résultat : perte des paramètres BIOS à chaque redémarrage, y compris le boot sur disque. Je la remplace par une neuve (CR2032 à 3,1V), et tout rentre dans l’ordre… en apparence.\n\nJe replace le serveur. Et là, à nouveau : plus rien. Ping muet. Services inaccessibles. Home Assistant muet. Zigbee2MQTT en erreur.\n\n---\n\n## Le vrai coupable : le switch réseau\n\nUn doute m’envahit. Je regarde le switch PoE. Il est éteint. Plus une LED.\n\nJe le remplace immédiatement. Nouveau switch, même câblage. Et tout revient :\n\n* Proxmox opérationnel\n* Partages NFS montés\n* Home Assistant réactif\n* Zigbee2MQTT sans erreur\n\n---\n\n## Le lien entre les deux incidents\n\nC’est là que tout devient limpide.\n\n* Le switch défaillant provoquait des microcoupures entre les VMs et le stockage.\n* Les erreurs ECONNRESET de Zigbee2MQTT venaient du lien instable entre le coordinateur Ethernet et le service.\n* L’instabilité du réseau expliquait les redémarrages en boucle, les commandes Zigbee échouées, les automatisations manquantes.\n\nEt pendant ce temps, je blâmais le coordinateur Zigbee, le firmware Ember ou un bug MQTT… alors que tout venait d’un simple **transformateur à 10€** du switch.\n\n---\n\n## Bilan\n\n### Ce que j’ai appris :\n\n* **Ne jamais sous-estimer un composant “passif”** : un switch, une pile, une alimentation.\n* **Un bug réseau peut se déguiser en bug applicatif**.\n* **Les microcoupures sont pires que les pannes franches** : elles érodent les services sans les faire crasher complètement, rendant le diagnostic flou.\n* **Observer avant d’agir**, c’est vital. Sinon, on démonte tout… pour rien.\n\n---\n\n## Et maintenant ?\n\nTout est reparti. Le coordinateur Zigbee SLZB-06M fonctionne parfaitement. Plus aucun redémarrage du service. Plus d’`ECONNRESET`. Les automatisations sont de retour.\n\n**Parfois, c’est \"juste\" un switch qu'il faut changer !**\n\n","featured":false,"files_meta":[],"external_links":[],"tags":[]} |