Aller au contenu
TonyC

HC3 - 5.050.13 - Stable - 09/10/2020

Recommended Posts

Dans les bases de données, souvent quand on supprime un grand nombre d'enregistrements d'un coup, cela libère de la place DANS la base, mais pas sur le disque, car les fichiers restent alloués.

Il faut lancer des requêtes d'optimisation pour réellement récupérer l'espace disque.

Peut être que ce processus est effectué par Fibaro occasionnellement : par exemple à chaque mise à jour. Mais pas systématiquement en tout cas.

Partager ce message


Lien à poster
Partager sur d’autres sites

Idem pour le cloud.

92% d'utilisation avec 2 backups.

Pour le passage en 5.050.13 je verrai peut-etre demain (occupation hard +++ aujourd'hui) - actuellement en 5.041.50 qui semble stable et efficace (plus de freeze en éditant des scènes par exemple).

Partager ce message


Lien à poster
Partager sur d’autres sites

Mise à jour faite !

 

Rian d'anormal à partager (pour le moment ?).

 

PS : Ce soir, les rubriques 5 (Dispositifs) et 6 (Général) sont inaccessibles !!!

       (malgré soft et hard-reset)

       Ca sent le rétropédalage.

 

 

PS : problème résolu (de lui-même ?)

1) restauration "Restauration avec la version" dimanche soir : échec de la procédure.

2) lundi matin, restauration du backup "Restaurer et convertir" (créé avant la 5.050.13) : avec succès !

 

Toutes les rubriques(à brac) sont de nouveau disponibles.

Je n'ai aucune idée du pourquoi et du comment, mais cela a bien fonctionné, je suis toujours en 5.030.13.

 

Modifié par Sowliny

Partager ce message


Lien à poster
Partager sur d’autres sites

Après deux jours, tout semble [stable] (déclenchement des triggers, déroulement des scènes...)

  • Like 1

Partager ce message


Lien à poster
Partager sur d’autres sites

Bonjour à tous :)

 

J'ai une scène qui se lance automatiquement au redémarrage de ma HC3, ou au redémarrage des services (par ex. après une sauvegarde), et qui m'envoi un push pour me prévenir. 

 

Depuis l'upgrade 5.050.13, je note que la box redémarre régulièrement toute seule à des heures rondes (09h ; 12h ; ...). Ce n'est probablement pas un hasard mais il ne semble pas y avoir de logique (ce n'est pas toutes les heures, hier elle a redémarré à 09h, aujourd'hui j'ai eu 11h puis 12h, ...). C'est assez étrange. 

 

Est-ce que vous avez noté, sur votre uptime, un comportement similaire ?

Partager ce message


Lien à poster
Partager sur d’autres sites

Hello,  j’ai également un script qui me pousse une notification au redémarrage et je n’observe pas de redémarrage du HC3 depuis la mise à jour. L’uptime est cohérent.

il faudrait vérifier toutes tes scènes et scripts Je pense

Partager ce message


Lien à poster
Partager sur d’autres sites

Ok. Merci Krikroff. Oui, c'est ce que je suis en train de faire, mais avant la MAJ je n'avais pas ce problème (et je n'ai modifié/ajouté/supprimé aucune scène depuis...). 

Partager ce message


Lien à poster
Partager sur d’autres sites

Je n'ai pas non plus noté ce comportement (reboot) avec ma HC3.

Pas de scène non plus, auparavant "normale", et qui provoquerait un reboot avec la 5.050.13.

 

Tout au plus des FGS qui s'activent en plein jour (éclairage extérieur) après un reboot.

Je pense fortement aux paramétrage des modules - il faudra que je me penche sérieusement dessus.

 

PS @Julien92130 : pas de problème d'alimentation ? Ou de gros consommateur qui générerait des perturbations en démarrant ?

 

S'il n'y a rien au niveau des la HC3 et des scènes, essaie d'échanger le bloc d'alimentation.

Il arrive que des blocs défectueux, au bout d'un moment chauffent et chutent leur tension de sortie, refroidissent, repartent, etc...

Modifié par Sowliny

Partager ce message


Lien à poster
Partager sur d’autres sites

@Sowliny, RAS côté alimentation : la box est sur un onduleur avec mes Synology. Le même onduleur qu'avant la mise à jour donc je suspecte vraiment un truc avec la dernière release. 

 

En fait, ce n'est pas un reboot complet de la box, c'est un redémarrage des services, car dans les logs je vois bien des mouvements de scènes et de devices quelques secondes avant et après les notifications. Trop short pour un reboot complet. 

 

J'ai fait un vrai redémarrage il y a 2 heures... Pour le moment RAS. On verra si j'arrive à avoir un uptime de plus de 10h :) 

 

Pour le reste, tout semble fonctionner donc à la limite ce n'est pas trop grave... Mais j'aime pas ne pas contrôler ce qu'il se passe :D 

Partager ce message


Lien à poster
Partager sur d’autres sites

Tu as vérifié le panneau de diagnostiques, au cas où tu serais à court de RAM ?

  • Like 1
  • Upvote 1

Partager ce message


Lien à poster
Partager sur d’autres sites

Je pense que tu est peut-etre dans le bon avec le vrai redémarrage.

J'ai fréquemment noté un comportement "aberrant" de la HC3 dans les versions précédentes, surtout avec l'enregistrement des scènes - mais maintenant c'est "stable".

Mais jamais ces reboot incontrôlés.

 

Bref, le seul moyen que j'avais de reprendre la main était justement de redémarrer en l'éteignant avec son bouton, puis en débranchant l'alim pendant un moment.

D'ailleurs, en règle générale, la HC3 semble "apprécier" les reboots "profonds", signe d'une instabilité larvée due à son immaturité flagrante (mais cela n'est que mon avis).

 

Modifié par Sowliny

Partager ce message


Lien à poster
Partager sur d’autres sites

RAS côté RAM. Depuis le dernier reboot "full", ça semble être rentré dans l'ordre... Je vais suivre ton conseil @Sowliny, je vais faire un arrêt complet régulièrement. Ca ne pourra pas faire de mal... 

 

Merci pour votre aide, toujours au top :)

  • Thanks 1

Partager ce message


Lien à poster
Partager sur d’autres sites

Hum ... perso le jour ou je dois reboot un équipement régulièrement pour qu’il fasse le job et bien il dégage vite fait
Tout ça pour dire qu’il faut investiguer et remédier et ne surtout pas prendre le parti de vivre avec, bien évidemment cela n’engage que moi


Envoyé de mon iPhone en utilisant Tapatalk

  • Like 2

Partager ce message


Lien à poster
Partager sur d’autres sites

Hello, je confirme avoir régalement eu 1 ou 2 "reboot", mais n'étant pas à la maison pas très pratique à tracer/analyser.

J'ai qlqs info comme quoi de nouveaux process de surveillances ont été implémentés dans cette version, mais pas plus de précisions que ça.

Comme évoqué par @Lazer, je pense qu'il faudrait jeter un oeil du coté de la RAM, car j'ai aussi constaté qu'elle avait une tendance à se libérer subitement avec une très forte amplitude et comme suspecté par @Julien92130 peut être dans certains cas cela abouti à un redémarrage des services en effet pas à un reboot.

  • Like 1

Partager ce message


Lien à poster
Partager sur d’autres sites

Le reboot automatique n'est pas nouveau, c'était déjà le cas dans les firmwares précédents, comme je l'avais déjà relaté sur le forum. Suite à un mauvais développement de ma part (une tentative de planter un QuickApp), ça avait magistralement abouti, donnant lieu à plusieurs reboots de suite et le déclenchement automatique d'un recovery avec restauration automatique de ma dernière sauvegarde.

 

Donc si vous avez des reboots automatique, je pense que vous savez où chercher : un de vos QuickApps (ou scènes) qui fait n'importe quoi.... typiquement une boucle infinie qui ne rend jamais la main au système, et consomme tout le CPU ou la RAM.

 

Pour rappel, il ne faut plus utiliser de sleep(), mais settimeout() à la place.

 

Je commence à avoir pas mal de QuickApps qui tournent sur ma box, et aucun ne provoque les phénomènes que vous rencontrez (reboot automatique, brusque variation de la RAM, etc)

 

Partager ce message


Lien à poster
Partager sur d’autres sites

Mmmm.. J'ai bien un sleep ou deux, je dois le reconnaître :rolleyes: mais dans une scène qui ne se déclenche pas aux heures impactées par les reboot (je m'en sert pour maîtriser la durée d'ouverture d'une électrovanne, quelques minutes seulement, pour mon arrosage automatique). 

 

Côté RAM, je suis à 67% stable (en tout cas ça en a l'air). 

 

Ce qui me turlupine dans cette histoire, c'est que le problème est apparu avec la 5.050.13, je n'ai jamais eu ce soucis avant. Constatant que, finalement, j'avais toujours des reboot intempestifs, j'ai descendu une backup en 5.040.37. Toujours sans rien modifier aux scènes et QA. Problème pour le moment résolu... On continue de croiser les doigts quelques heures encore pour s'en assurer.... 

Partager ce message


Lien à poster
Partager sur d’autres sites

Le downgrade n'est pas une solution, ça me rappelle l'expérience de @jjacques68 qui s'en rendu compte après coup que c'était bien ses codes LUA qui faisaient crasher la box.

Disons qu'un code LUA mal foutu peut donner l'impression qu'il fonctionne, mais il donnera un résultat différent au prochain firmware (modification du comportement des API, du watchdog intégré, etc)... et amènera à un plantage

 

Un ou 2 sleep ne sont pas forcément un problème s'ils sont de très courte durée (quelques millisecondes, quelques secondes, mais pas plus) et qu'ils ont lieu occasionnellement.

Cependant une boucle infinie basée sur des sleep, c'est le crash assuré.

Le sleep() ne rend pas la main au système, donc il paralyse le fonctionnement du QuickApp ou de la scène.... pendant ce temps là, aucun autre événement ne peux se déclencher (typiquement l'appui sur un bouton, etc)

Et c'est vicieux, car ça ne se verra ni sur le consommation de RAM, ni sur celle de CPU.

 

Il faut utiliser des settimeout()

 

Par contre il faut revoir tout son code, car c'est la logique asynchrone... pas évident de s'y faire au début.

 

  • Like 2

Partager ce message


Lien à poster
Partager sur d’autres sites

@LazerBen qui parle de reboot ? :) la nuance a justement été placée sur relance des services, et oui sans modifs aucunes ayant une scène justement qui log le reboot, ce phénomène je ne l'ai constaté qu'après l'introduction de cette version. 

Perso je pense qu'il faut y prêter un minimum d'attention à ce truc là, je ne suis pas à la maison donc incapable de dire combien de temps prend cette" relance de services", c'est généralement très rapide, mais quand on laisse tout le monde à la maison avec des moyens limités pour intervenir, c'est pas trop le genre de truc que j'aime bien :) ça sent le grosse bidouille pour pallier à autre chose de plus violent qu'on ne sait pour l'instant pas fixer, mais bon....

Partager ce message


Lien à poster
Partager sur d’autres sites
il y a 3 minutes, TonyC a dit :

je ne suis pas à la maison donc incapable de dire combien de temps prend cette" relance de services"

J'ai constaté quelques secondes, une dizaine environ

Partager ce message


Lien à poster
Partager sur d’autres sites
Il y a 4 heures, Julien92130 a dit :

Je vais suivre ton conseil @Sowliny, je vais faire un arrêt complet régulièrement. Ca ne pourra pas faire de mal... 

Je me suis peut-etre mal exprimé.

Je ne voulais pas parler de reboots réguliers, mais quand le besoin s'en fait manifestement sentir.

J'en faisais beaucoup il y a 2 ou 3 versions, mais actuellement, avec la 5.050.13, (mis a part la m.à.j. qui en a occasionné plusieurs), tout va (très) bien.

 

Malgré qu'il me reste un ou deux sleep, que je suis en train de convertir - c'est d'ailleurs l'occasion de revoir tout le code en question, ce qui permet une optimisation salutaire).

  • Haha 1

Partager ce message


Lien à poster
Partager sur d’autres sites

@TonyC bah justement, sur mon HC3 la première règle de GEA me signale par notification Push un redémarrage du Quickapp... et la 2nde me signale un redémarrage des services... et ce n'est justement pas le cas depuis que j'ai fait cette mise à jour

Donc je ne rencontre pas ce souci, alors que vous êtes au moins deux. Donc il y a bien un souci sur vos 2 box. On a le même firmware, la différence, ce sont nos codes LUA. Et aussi les modules Z-Wave, dès fois que le problème vienne du moteur Z-Wave. Mais comme @Krikroff (qui a migré tous ses modules) n'a pas non plus de souci et que je lui fait confiance pour la qualité de ses codes LUA, je me dis que c'est vraiment là qu'il faut chercher.

 

Dans le doute, faut désactiver les QuickApps et Scènes une par une jusqu'à identifier le fautif.... c'est fastidieux je sais.

 

Pour en revenir aux sleep(), j'en utilise quelques-uns, mais dans des circonstances bien précises.

Par exemple dans le déroulement d'un code séquentiel, je fais une action, et j'ai besoin d'attendre 1 seconde, puis de continuer. Là je le fais avec un sleep()

Cela ne pose à priori pas de problème.

 

A l'inverse, s'il s'agit d'une boucle infinie qui doit répéter une action à intervalle régulier (ou irrégulier d'ailleurs), là c'est bien le settimeout() qu'il faut utiliser.

Partager ce message


Lien à poster
Partager sur d’autres sites

@Lazer, me suis mal exprimé, peut être.

 il est possible que du code mal gaulé et je parle pour moi, je ne suis pas suis pas suffisamment capé coté dev, soit à l'origine de ces redémarrages. Ce que je dis juste, c'est que je suis conscient qu'un certain nombre de process de surveillance ont été mis en place lors de cette dernière version et que peut être l'un d'eux fait de l'excès de zèle, à juste titre...  ou pas. 

En effet ce qui distingue nos box est la charge en module mais comme tu le dis toi même, pas que. La nature de la qualité du code est un élément différentient,  cependant en ce qui me concerne, ni le code ni le nombre de modules n'ayant changé dans ma conf et que seul l'upgrade du firmware à mis en évidence ce comportement, je m'interroge donc  mais n'arrive en aucun cas en aucunes conclusions, n'ayant pas pris le temps d'analyser la situation, quand bien même peut on parler d'analyse, n'ayant aucun moyen simple de le faire.

Bref je ne contre dit pas tes dires, tu es 1000 fois plus calé que moi, mais cependant pas d'accord sur les short cuts, il me semble qu'il y a un comportement inexpliqué, que ça vaut la peine d'y accorder de l'attention pour ne pas se retrouver dans de mauvaises situations lorsque ta hc3 sera en prod, ce qui est déjà le cas pour moi depuis quelques mois maintenant chargé ras la gueule de plus de 200 ++ qu'ils soient zwave, via satel, ou QA/broker mqtt ou autre.

Je n'arrive donc surtout pas à la conclusion de j'enlève mon slip et on tout sera cool <- là je déconne on est d'accord :P. Le sleep oui ça été dit en long large et travers, mais quand bien même, s'il n'est pas supporté on le dégage, ça fera des mécontents car ré-écriture de code mais que ça n'aboutisse pas à une instabilité du système tout entier et âs à des workaround foirax. Je dis ça par réaction sur l'exemple, mais perso je ne suis en aucun capable de dire que mister "sleep" en est l'une des causes de ce redémarrage zou pas. 

La route de la stabilité sera encore longue, le meilleur reste probablement à venir, attendons les modifs de fond tel que la ré-écriture du moteur zwave, ça donnera encore pour longtemps de l'espace à de longs sujets d'échanges :) 

 

 

Partager ce message


Lien à poster
Partager sur d’autres sites

×