Discussion de forum

Avatar de FrancisL
FrancisL
Chevalier
12-24-2020

Connexion Port Ethernet câble très lente depuis version 4.4 de Hélix

Bonjour,

 

J'ai découvert que depuis EXACTEMENT le moment où ma borne Hélix a été mise à jour de la version 4.2 à 4.4 (Software Image Name:CGM4140COM_4.4p6s1_PROD_sey en se connectant à la page Admin sur votre browser), ma connexion filaire Ethernet est très difficile à obtenir. Ça prend 33sec. Linux, Windows, OSX, c'est du pareil au même. Mes parents ont le même problème donc c'est clair que ce n'est pas mes OS, mes machines ou ma borne.

 

Sous Linux j'ai plusieurs deamons et services qui pokent la connexion internet et après un certain temps ils time out et ne démarrent pas. Je dois tjrs le faire à la main, à chaque jour, chaque démarrage, chaque retour d'une mise en veille, etc. De plus à chaque démarrage ça gèle en attente d'une partie de la connexion. Très fatiguant tout ça.

 

J'ai ouvert un billet le 23 déc vers 14h15 et je vais les appeler à nouveau pour leur indiquer qu'une seconde borne a le même problème, car le gars m'a dit que j'étais le 1er à logger ce issue et quand y a juste 1 cas y font pas grand chose.

 

Parfois mon Linux ne veut carrément pas connecter. Je m'en sors en forçant la config IP manuellement, adresse, DNS, gateway, etc... ça aide, mais ça demeure lent et me cause plein de troubles.

 

 

J'aimerais savoir s'il y a des cobayes pour effectuer ce test avec votre borne. L'ennui c'est que si vous n'appelez pas Vidéotron pour logger le problème, ils ne voudront pas que moi je le logge officiellement en votre nom, bien évidemment je pourrais dire ce que je veux! Et c'est correct de leur part.

Si vous n'êtes pas prêt à les appeler, alors oubliez ceci, mais si ça vous intéresse de dire à Vidéotron que vous avez le même prob qu'un parfait inconnu, ça m'aiderait énormément à régler mes problèmes de connexion et je vous en remercie fortement à l'avance.

 

La MAJ à la version 4.4 a eu lieu au début décembre, peut-être avant, moi je l'ai eue tardivement selon le gars, le 19 décembre, parmi les derniers. Mes parents l'ont eu le 9.

 

Bien sûr j'ai fait un RESET TO FACTORY SETTINGS de la borne. Même avec la config 100% de base c'est exactement le même problème.

 

Donc si vous testez disons avec Windows, vous devez aller dans le Control Panel, ensuite la configuration Network puis Adapter Settings. Là vous y verrai toutes les cartes réseaux, incluant celles virtuelles. Pour voir le status de connexion de la carte, qui indique entre autre le nombre de secondes/mins/heures de connexion, un clique-droit sur la carte Ethernet et STATUS va vous montrer ça. Assurez-vous de prendre la bonne carte. C'est là que vous voyez que ça prend 33sec à connecter, soit une éternité pour une connexion Ethernet.

 

Si vous testez avec Linux, ça risque fort de geler 10-15-20sec en plein milieu du démarrage de votre distro comme moi, car le service NetworkManager-wait-online sert justement à attendre que la connexion s'établisse avant de poursuivre le boot process. Une fois booté vous pouvez également faire du monitoring et voir le délai de connexion.

 

Si vous ne savez pas trop de quoi je parle dans les 2 précédents paragraphes, alors ça serait préférable que vous ne fassiez pas ce test. 🙂 La très très forte majorité des gens vont penser que ce délai est normal et n'y verront que du feu, si c'est votre cas ne vous attardez surtout pas à ce message. Windows semble mieux gérer ce délai que Linux et donc ça risque encore moins d'affecter 90% de la population.

 

 

Merci de votre aide et je vous souhaite du bon repos pendant le temps des Fêtes!

Francis

  • Bon je viens de faire une trace sur le port ethernet de la borne helix, je unplug ensuite replug, je vois quelque chose de très particulier, le laptop envoie des dhcp mais aucune réponse de la borne pendant comme vous avez vu autour de 30sec, autour de la 30ieme seconde je vois la borne répond au dhcp.

    J'ai fais plusieurs tests+traces pour me convaincre, la même chose toutes les fois.

    Donc c'est un bug de la borne.

    J'ai une petite idée du bug, je vois des packets STP (bridge protocol) venant de la borne, et leur délai pour forwarder est de 15sec, en petit recap le STP est utilisé pour éviter des loop dans les switch ethernet.

    Voici la cause de votre 30sec: (cherche "stp forward delay" dans google).

    The Forward Delay timer defines the time that is spent in Listening or Learning state. The default Forward Delay value is 15 seconds. This means that the port stays in Listening state for 15 seconds and then stays in Learning state for another 15 seconds before transitioning to the Forwarding state.

    Vu que vos machines ne sont pas les switch ethernet, c'est donc inutile que Helix fait le STP sur leur port ethernet, pour fixer le problème, videotron devrait avoir une config qui permet de mettre ON ou OFF le STP, mais bonne chance pour votre fix car Videotron gosse pas dans le firmware de Helix qui vient de Comcast et que c'est Technicolor qui fait le vrai travail 8-)

    Comme work-around poche, je vous suggère de mettre vos devices wire sur un routeur qui branche sur la borne helix, ça masque le problème.

    Joyeux Noel à tous.

  • Avatar de SamusAran
    SamusAran
    Super utilisateur

    Ma borne est à la version 4.6p3s3.   J'utilise Windows 10 sur mon PC. Il y a effectivement un délai d'environ 30 secondes après la réactivation de la carte réseau avant que la connexion IPv4 soit fonctionnelle.  Même délai si je débranche et rebranche le fil Ethernet.

     

    En WiFi c'est instantané.  Très weird.

     

    Bizarrement aussi, mon ordi n'a pas de connexion IPv6 mais mon iPad et mon Pixel 4 ont leur adresses IPv6 publiques.

  • Salut Francis,

    J'ai aussi la version CGM4140COM_4.4p6s1_PROD_sey, parcontre mon Hélix est en routeur-mode et mon ancien router ASUS connecte sur le eth1 de Hélix.  Je reboot tous les jours à 5am mon ASUS, mon vieux ASUS est encore le main routeur qui marche très bien, je note que le dhcp lease dure 48h.

    Si tu es un nerd de réseau, peux-tu capturer les packets avec wireshark, ça aiderait à voir ce qui ce passe.

    Je vais essayer de reproduire et capturer la trace.

    Mon intuition me dit que le port ethernet sur Helix fait peut-être un genre de port authentication pour limiter juste un mac address par port.

    Il serait intéressant de voir sur la ligne quand tu plug ton cable et le moment que tu recois le dhcp.

    Bon troubleshooting.

     

  • À la fin octobre dernier, j'ai eu d'énormes problèmes avec le DHCP de la borne Helix. Mes ordis avec adresses DHCP fixes changeaient d'adresse quand même, des fois des adresses en dehors  de la plage alloué au DHCP étaient attribuées.  J'ai même eu des iPad et ordis qui indiquaient un erreur d'adresse déjà utilisé ailleurs. À la minute que j'ai mis tout mon réseau derrière un autre routeur, mes problèmes on cessés. Ma version était 4.2P14s1 à ce moment.  

     

    Le fait qu'ils aient appliqué une version 4.4 et même 4.6 c'est probablement qu'ils tentent de corriger ces problèmes de DHCP.

     

    Présentement, j'ai 4.4 mais je n'ai pas réessayer pour voir si mes problèmes sont toujours présents.  Je vais tester ça ce week-end et je vous dirai si j'ai le problème du 30 sec d'attribution d'adresse IP de la part du serveur DHCP de la borne.

     

     

  • Bon je viens de faire une trace sur le port ethernet de la borne helix, je unplug ensuite replug, je vois quelque chose de très particulier, le laptop envoie des dhcp mais aucune réponse de la borne pendant comme vous avez vu autour de 30sec, autour de la 30ieme seconde je vois la borne répond au dhcp.

    J'ai fais plusieurs tests+traces pour me convaincre, la même chose toutes les fois.

    Donc c'est un bug de la borne.

    J'ai une petite idée du bug, je vois des packets STP (bridge protocol) venant de la borne, et leur délai pour forwarder est de 15sec, en petit recap le STP est utilisé pour éviter des loop dans les switch ethernet.

    Voici la cause de votre 30sec: (cherche "stp forward delay" dans google).

    The Forward Delay timer defines the time that is spent in Listening or Learning state. The default Forward Delay value is 15 seconds. This means that the port stays in Listening state for 15 seconds and then stays in Learning state for another 15 seconds before transitioning to the Forwarding state.

    Vu que vos machines ne sont pas les switch ethernet, c'est donc inutile que Helix fait le STP sur leur port ethernet, pour fixer le problème, videotron devrait avoir une config qui permet de mettre ON ou OFF le STP, mais bonne chance pour votre fix car Videotron gosse pas dans le firmware de Helix qui vient de Comcast et que c'est Technicolor qui fait le vrai travail 8-)

    Comme work-around poche, je vous suggère de mettre vos devices wire sur un routeur qui branche sur la borne helix, ça masque le problème.

    Joyeux Noel à tous.

    • Avatar de rlmicrosa
      rlmicrosa
      Viking
      Je suis aussi à la version 4.4p6s1_PROD_sey. J’ai présentement une switch 48 ports managed branchée dans le port 1 de la borne Hélix.
      Je vais faire des tests avec des devices directement dans le port 2 et aussi directement dans la switch. Je vous reviens avec des résultats. 🙂
  • Hey merci les gars!

     

    Je pensais avoir une notification par email quand il y a des réponses mais non, alors j'ai tout manqué avant aujourd'hui. 😞

     

    Bon alors bonne nouvelle, en partie. Le 28 déc lorsque j'ai rallumé ma machine en sortie de mise en veille, mon Network Manager de Kubuntu ne listait plus aucune connexion incluant celles de test que j'avais créées. J'avais des apps d'ouvertes et surtout une longue liste d'historique d'output dans le command line (terminal) pour des scripts que j'étais en train de créer la veille. Je n'ai pas réussi à repartir les services et deamons et j'ai donc dû sauvegarder mon historique du command line dans un fichier pour reprendre mes tests au même endroit après un reboot complet.

     

    Là c'en est assez. J'ai sacré et fessé sur ma chaise loll, alors j'ai appelé Vidéotron.

    Après 48mins avec le tech en ligne (il était super) et des tests live sur 3 machines totalement différentes, il a pris en note les modèles et MAC address (why?) de mes cartes réseaux sur mes machines et il a escaladé le problème à COMCAST.

     

    Bien qu'il n'y ait aucun suivi sur ce bug (!!!!), il dit que lorsque Vidéotron escalade un prob à Comcast c'est tjrs réglé. On verra bien, mais d'après ce que je vois non seulement ce prob est reproducible partout mais en plus HMatrix a mis le doigt sur qque chose de vrm anormale qui correspond exactement aux 30sec de délai.

     

    En fait le 28 mon prochain test aurait été de tracer les paquets, ça fait hyper longtemps j'ai pas joué là-dedans mais ça serait revenu. Maintenant que le test a été fait (merci HM) et que anyway le bug est en escalade à Comcast, y a pu d'info que j'puisse fournir à Vidéotron.

     

    Il me reste un vieux Linksys router, mes 4 autres sont kapout. J'ai fait des tests ce matin chez mes parents car le router est là et il est encore sur sa config de tests que j'avais fait en mai dernier lorsqu'ils avaient eu leur borne Hélix. J'arrive même pu à me connecter au routeur Linksys (la page admin) et il est encore en DHCP Forward sur la borne Hélix. Je vais devoir lui faire un reset to defaults avec le piton à l'arrière et espérer que ça briquera pas le routeur.

     

    Par contre j'ai pu voir qu'en DHCP Forward le délai de 30sec est ajouté au délai de connexion standard, ça prenait genre 45-47sec total. Je dois revoir la config et reprendre from scratch, en espérant qu'il pourra se resetter...

     

     

    En attendant pe un jour le fix de Comcast, je set ma config IP manuellement sur la carte réseau, donc IP, Gateway, Subnet et DNS et ça aide à éviter de ne pas reconnecter pantoute. C lent, mais ça semble reconnecter + souvent que si j'étais en full mode automatique DHCP.

     

    Donc je vais tenter de tester avec ce routeur et sinon je verrai la suite...

     

    Merci à tous, ça m'a permis de voir bcp + clair là-dessus et de m'orienter pour les prochaines étapes en attendant un fix ou si aucun fix n'arrivera....

    Et Bonne Année aussi! 🙂 Un année plein d'Internet et sans virus! (bonne joke)

    • Avatar de FrancisL
      FrancisL
      Chevalier

      Alors j'ai fait le test avec un vieux Linksys et ça prend 3sec à établir la connexion!!

       

      Donc les math ne mentent pas : le STP (dont HMatrix a mentionné) cause un double délai de 15sec, allée et retour, donc 15+15+3 dans mon livre à moi ça fait 33sec. Ce qui est exactement le délai total que ça me prend à chaque fois (quand ça connecte) lorsque je suis pluggé direct dans la borne.

       

      Bravo les gars pour toutes ces infos, vous êtes imbattables!

       

      Alors comme mon vieux Linksys est 13 fois plus lent que ma connexion Vidéotron normale, j'ai dû m'acheter un switch. Au final je vais pe ben la conserver, mais au moins ma connexion sera rapide et mes problèmes réglés, peu importe ce que Comcast fera...

      • Avatar de HMatrix
        HMatrix
        Spartan

        Salut FrancisL ,

        Bonne année à toi et la gang sur ce forum, j'ai eu du fun à regarder ton problème.  Je travaille 26+ années en réseau depuis les années 90's 8-) J'ai encore le feu sacré/le fun dans ce domain, parcontre ça me fait peur quand tu dis "le STP de HMatrix cause un double délai" 8-))

         

        En fait le fixe est assez simple pour corriger le problème, message pour Videotron->Comcast->Technicolor, ou bien disabler le STP, ou bien baisser la valeur de "Forward Delay" à une valeur plus petite, au lieu de 15 utilise 1 par exemple ou 0, vu que le réseau de Helix est un réseau maison, pas trop critique de baisser le Forward Delay à une valeur très courte.

         

        J'ai lu dans ce thread que sur Windows ça semble mieux aller que Linux, c'est facile à expliquer, le dhcp client fait des requests, sur linux il y a un délai pour envoyer le prochain request tout comme Windows, le délai double quand le server répond pas, j'ai pas fait de trace avec mon laptop linux mais je pense que les délais sont peut-être trop conservateur avant le prochain envoie du dhcp-request. 

        Pour ceux qui sont intéressés, je peux vous partager la trace wireshark que j'ai fait avec Win10.

         

        Sur mon routeur ASUS AC68P je roule merlin-wrt firmware, c'est très simple de faire ce que je suggère en haut, soit disable le STP et changer le forward delay, tous les routeurs wifi sont basés sur linux, avec la command brctl on peut configurer tout ça sur Helix, "on" excluant la personne qui parle.

         

        admin@RT-AC68P-BC28:/tmp/home/root# brctl showstp br0
        br0
        bridge id 8000.ac9e179dbc28
        designated root 8000.ac9e179dbc28
        root port 0 path cost 0
        max age 20.00 bridge max age 20.00
        hello time 2.00 bridge hello time 2.00
        forward delay 0.00 bridge forward delay 0.00
        ageing time 300.00
        hello timer 1.78 tcn timer 0.00
        topology change timer 0.00 gc timer 88.82
        flags

         

        Usage: brctl [commands]
        commands:
        addbr <bridge> add bridge
        delbr <bridge> delete bridge
        addif <bridge> <device> add interface to bridge
        delif <bridge> <device> delete interface from bridge
        setageing <bridge> <time> set ageing time
        setbridgeprio <bridge> <prio> set bridge priority
        setfd <bridge> <time> set bridge forward delay

         

         

  • HMatrix, je vais parler de ça à mes développeurs, voir s'ils ont peur. 🙂

     

    J'ai fait un tcpdump au moment d'effectuer la connexion, on partage un fichier comment ici?

     

    Sinon je peux faire un copy-paste du texte, j'ai filtré les lignes répétitves et tout le blabla du IPv6. Ça donne 47 lignes. À mon avis ça prend + que 33sec sous Linux. Évidemment branché dans mon routeur qui lui est branché dans le port de la borne, ça se connecte en 3sec.

     

    Nah le 142.1.1.1 c'était un chiffre sorti vitevite de même comme exemple, en fait je me demande si la borne ne va pas empêcher de setter une IP qui n'est pas dans le range des réseaux internes... à tester.

    • Avatar de HMatrix
      HMatrix
      Spartan

      FrancisL 

      Pour la trace si tu peux juste filtrer avec 'bootp' pour juste voir dhcp et afficher la colonne Time "Time since previous display packet" , ensuite "Export Packet dissection -> CSV"

       

      Voici ma trace sur un laptop Win10 à partir au moment ou je branche le câble dans le laptop. il est en csv, la colonne Time donne l'interval de temps pour les retries.

       

      "No.","Time","Data rate","Signal strength (dBm)","Source","Destination","Protocol","Length","Timestamp","Sequence number","Info"
      "36","0.000000","","","0.0.0.0","255.255.255.255","DHCP","364","","","DHCP Request - Transaction ID 0xbba66272"
      "66","1.490007","","","0.0.0.0","255.255.255.255","DHCP","364","","","DHCP Request - Transaction ID 0xbba66272"
      "147","2.219846","","","0.0.0.0","255.255.255.255","DHCP","364","","","DHCP Request - Transaction ID 0xbba66272"
      "269","2.656470","","","0.0.0.0","255.255.255.255","DHCP","364","","","DHCP Request - Transaction ID 0xbba66272"
      "428","5.993419","","","0.0.0.0","255.255.255.255","DHCP","364","","","DHCP Request - Transaction ID 0x4c2b790f"
      "450","1.938155","","","0.0.0.0","255.255.255.255","DHCP","364","","","DHCP Request - Transaction ID 0x4c2b790f"
      "548","3.002523","","","0.0.0.0","255.255.255.255","DHCP","364","","","DHCP Request - Transaction ID 0x4c2b790f"
      "767","16.316618","","","0.0.0.0","255.255.255.255","DHCP","344","","","DHCP Discover - Transaction ID 0xa9eab48a"
      "768","0.009366","","","10.0.0.1","LAPTOP-8RLKDFJC.local","DHCP","342","","","DHCP Offer - Transaction ID 0xa9eab48a"
      "769","0.001619","","","0.0.0.0","255.255.255.255","DHCP","370","","","DHCP Request - Transaction ID 0xa9eab48a"
      "770","0.023166","","","10.0.0.1","LAPTOP-8RLKDFJC.local","DHCP","362","","","DHCP ACK - Transaction ID 0xa9eab48a"

       

      Si tu veux voir la relation du dhcp et le stp, mets le filtre 'bootp || stp'  tu verras le stp de helix va flagger un Topology Change flag autour de 30sec après que le câble soit branché, helix va mettre son port ethernet en forwarding mode pour être 100% fonctionnel. 

      • Avatar de FrancisL
        FrancisL
        Chevalier

        Ouais je pourrais grepper pour "bootp", attends HMatrix aussi ben le faire manuellement avec mon log actuel...

        Voici le log au complet filtré selon mon dernier message et ajoutant un "grep | 'bootp'" :

         

        13:07:15.664924 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from b4:2e:99:a6:72:42, length 285
        13:07:40.593562 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from b4:2e:99:a6:72:42, length 285
        13:08:13.436949 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from b4:2e:99:a6:72:42, length 285
        13:08:16.454417 IP 10.225.7.1.67 > 10.225.8.24.68: BOOTP/DHCP, Reply, length 300
        13:08:16.454520 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from b4:2e:99:a6:72:42, length 297
        13:08:16.480407 IP 10.225.7.1.67 > 10.225.8.24.68: BOOTP/DHCP, Reply, length 309

         

        On dirait que ça a pris 1min avant d'avoir un reply!

  • J'ai exactement le même problème et la réponse de Vidéotron c'est que ça changera pas et que j'ai juste à connecter mes périphériques par WiFi! Ils disent que c'est mon ordi, ma télé et mes câbles qui ont un problème (tout le monde sait que les câbles, ça cause des délais de connexion, t'sais!)...! J'en reviens pas qu'ils soient au courant du problème!

    • Avatar de FrancisL
      FrancisL
      Chevalier

      olivierbio, rappelle-les et donnes leur les dates de l'historique du problème qui a été loggé chez eux, tout est plus haut dans la conversation.

      Tu peux ajouter que le problème est entre les mains d'un technicien du Niveau 2. J'ai son nom mais je n'ose pas l'écrire ici en public.

       

      La borne permet une connexion filaire, donc de dire de connecter Wifi n'est pas une solution acceptable.

      De plus certains hardware (comme mon motherboard!) n'ont pas de wifi intégré et c'est voulu et connu de l'acheteur averti comme moi. J'en voulais pas wifi sur ma machine principale.

  • J'ai clavardé avec un certain Philippe T. qui m'a dit que le problème était bien connu chez Vidéotron (eh bien!) et que lui-même l'avait. Il a communiqué avec un autre département (je ne sais pas lequel), et apparemment que c'est une caractéristique de l'équipement et non un problème, donc il se peut que ce soit corrigé comme il se peut que ce ne le soit pas. Aucun délai approximatif ne peut m'être donné... À suivre...!

    • Avatar de FrancisL
      FrancisL
      Chevalier

      olivierbio "Caractéristique de l'équipement", on peut dire oui. Cependant c'est une caractéristique "logicielle", qui est apparue à la seconde ou la borne a redémarré dans la nuit où la MAJ du software a été fait à la v4.4. Comme c'est pas "hardware", c'est beaucoup plus facile à corriger, mais évidemment faut que ça soit priorisé et que quelqu'un s'y mette.

       

      Et comme aucune date n'est visée ou communiquée aux clients, c'est pourquoi une bonne solution espérons temporaire est d'utiliser une switch (entre 15 et 30 piasses ça fait la job) branchée sur la borne et l'ordi branché dans la switch.

  • Eh voilà c'est réglé.

     

    Drôle de timing mais l'équipe de l'ingénierie a demandé à changer ma borne, ce qui a été fait lundi matin le 8 fév.

     

    Le problème était le même avec la nouvelle borne, ce qui était attendu...

     

    Mais voilà que dans la nuit de lundi à mardi les 8-9 fév, aux petites heures, une MAJ du software a été fait, de la v4.4 à v4.6! Et depuis le problème est réglé! Comme prévu aussi, que c'était relié software...

     

    Super. Et merci à Vidéotron pour avoir suivi cette problématique.