[0.8.0-2657] Node-Blue bleibt täglich stehen (gelöst)

Hallo @job,

puh, das Problem ist nicht ganz leicht zu identifizieren. Ich sehe, dass die RPC-Anfragen hängen. Das liegt offenbar daran, dass ein Thread in der C-Funktion send() zu hängen scheint, was eigentlich nicht sein kann. Arbeitsspeicherprobleme gibt es nicht oder? Es gab tatsächlich einen kleinen Fehler in der aufrufenden Methode, welchen ich im nächsten Nightly behoben habe (2670). Könntest du dieses installieren, ipcLog = true in der main.conf setzen, und mir das IPC-Log (liegt dann auch in /var/log/homegear) und wieder die GDB-Ausgabe schicken?

Das Kompilieren habe ich manuell angestoßen und in 4 bis 5 Stunden sollte das Nightly online sein.

Viele Grüße

Sathya

1 Like

Hallo @sathya

Ich habe gerade 0.8.0-2671 installiert. Ich liefere den output natürlich erst, wenn der Prozess nicht mehr funktioniert. :wink:

Vielleicht war es ja der “kleine Fehler” bereits.

Es gibt jetzt im Log-Ordner ein Socket:

Vielen Dank und viele Grüße

Joachim

1 Like

Hallo @sathya

Definitiv nicht. Seitdem da openHAB nicht mehr drauf läuft, ist der RasPi 3+ fast schon Overkill. :wink:

So, hier ist der nächste Lauf. Stehen geblieben gegen 18:00.

homegear_gdb.txt (108,5 KB)
node-blue_gdb.txt (78,2 KB)

Das ipc-log ist mit 72mb wieder zu groß, kannst du mir noch einmal so einen upload speicher zuweisen?

Vielen Dank und viele Grüße

Joachim

1 Like

Vielen Dank!

Das ipc-log ist mit 72mb wieder zu groß, kannst du mir noch einmal so einen upload speicher zuweisen?

Klar hier: https://cloudl.eu/index.php/s/mFE2wXMW54mAqJs

1 Like

Auf jeden Fall exakt das gleiche Bild in GDB wie das letzte Mal.

1 Like

Vielen Dank für den Upload. Ich schaue mir das Log gerade an. Eine Sache würde mir auch noch helfen: Könntest du beim nächsten Absturz nur den Node-BLUE-Prozess abschießen (mit kill -9) und schauen, ob dann wieder alles funktioniert? Ich würde gerne sehen, ob mit dem Homegear-Hauptprozess alles in Ordnung ist.

Viele Grüße

Sathya

1 Like

Ah, wir nähern uns: Könntest du deine beiden ping-Knoten deaktivieren? Diese sind nicht die Ursache des Problems, triggern es aber offenbar. Der Signalhandler beim Beenden des ping-Prozesses scheint den Deadlock auszulösen.

1 Like

ping-Knoten sind dekativiert.

Hallo @job,

es ist sehr gut möglich, dass das Problem im nächsten Nightly gelöst ist - und es war ein schwerwiegender Fehler (nicht erlaubte Funktionsaufrufe im Signalhandler). Falls Node-BLUE mit den deaktivierten ping-Knoten soweit läuft, probier mal mit aktivierten ping-Knoten das nächste Nightly (2677).

Viele Grüße

Sathya

2 Likes

Sehr schön, seit der Deaktivierung der Knoten noch kein Absturz. :smile:

Sobald die 2677 da ist, installiere ich die und aktiviere die Knoten wieder. Komisch nur, dass es erst jetzt aufgetreten ist, die beiden Ping-Knoten habe ich gefühlt seit einer Ewigkeit.

1 Like

Ich habe gerade versucht, die 2678 zu installieren. Leider hat es nicht geklappt.

Ich gehe jetzt auf die Version von vorgestern (20190608) -2671 zurück.

Hallo @job,

da war ein Fehler im Nightly-Skript durch gerade geänderte Abhängigkeiten. Jetzt sollte es wieder gehen.

Viele Grüße

Sathya

… und ich habe einen ärgerlichen Fehler eingebaut… Warte bitte noch auf 2681. Btw. gibt es jetzt eine Python-Node ;-).

ups. Zu spät. :wink:
Gerade gemacht und einen Haufen ping-Nodes dazugepackt.

Welchen Effekt hat der Fehler?

Du bekommst keine SIGCHLD-Signale. Das Beenden von Prozessen wird Homegear nicht angezeigt. Das gilt aber nur für den Homegear-Hauptprozess und Homegear Management. Die ping-Nodes müssten funktionieren. Die neue Version wird bereits kompiliert und sollte in kürze online sein.

So, ich installiere gerade die -2681. Ich habe 10 ping-nodes aktiviert und das ipc-log eingeschaltet.

Sollte ich sonst noch etwas beachten?

Wo wir gerade an der ping-node sind, hast du das hier schon gesehen, @sathya?

Hallo @job,

Sollte ich sonst noch etwas beachten?

Nee, das passt. In der neuen Signalimplementierung war noch ein weiterer kleiner Fehler. Also bitte auch das nächste Nightly installieren, sobald es online ist. Das zieht sich leider etwas, da das neue Nightly jetzt erstmals homegear-ui enthält und die Abhängigkeiten mich etwas geärgert haben.

Wo wir gerade an der ping-node sind, hast du das hier schon gesehen, @sathya?

Schaue ich mir an. Danke.

Viele Grüße

Sathya

1 Like

Seit dem Update auf 0.8.0-2692 (vor 3 Tagen) ist Node-Blue nicht mehr stehengeblieben. Da das vorher alle paar Stunden passiert ist, gehe ich davon aus, dass das Problem gelöst ist.

Das ipc-log schalte ich jetzt mal wieder ab, das ist schon fast 1 GB groß, das möchte ja niemand lesen.

Vielen Dank, @sathya.

2 Likes