Hallo,
es ist einfach zum Haare raufen. Wie Ihr in einem anderen Post von mir lesen könnt, betreibe ich seit längerem eine Installation mit 3 HomeGear-Gateways, jeweils auf einem Raspberry Pi 3 mit CC1101. Die 3 Gateway-PIs sind irre stabil, ich musste seit Ewigkeiten keinen mehr davon rebooten. (Build 2362).
Die Homegear-Installation die Ärger macht ist jene, die sich auf einem Intel-NUC-System befindet und dort in einem Docker Container ihr dasein fristet. Konkret ist es eine AMD64 Installation des ResinOS basierenden HomeAssistant (HA). Wobei der HA in zwischen eher selten so installiert wird. Aber um auf einem NUC zu laufen geht es “nicht anders”.
Ich habe dafür also ein eigenes Repo angelegt, mit dem eine Docker-Installation spezifisch für ResinOS und HA ausgerollt wird. Bis auf die Prozesspriorisierung wird dort alles “nach Handbuch” umgesetzt. Er startet einwandfrei, holt sich seine Datenbank vom lokalen Share (kein Fileshare, sondern gesharedtes Verzeichnis im Docker-Context), etc. Nach einer Weile erfolgt die Meldung SigAbrt caught Signal 6, und der Daemon wird von der übergeordneten Homegear-Instanz neugestartet.
Zunächst “behob” ich das Problem, in dem ich HA so scriptete das er 2 Minuten nach dem letzten Empfang einen Reconnect zum HomeGear machte. Ja ich hatte keine Zeit und keinen Nerv dem Problem näher auf den Grund zu gehen. Es gab halt irdische Dinge, die einfach wichtiger waren. (Docker-Build mit 2362)
Am zurückliegenden Wochenende fand ich endlich Zeit zu genaueren Fehleranalyse (und einem Update auf die 2374). Ich drehte also in der main.cfg den Debugging-Wert auf 5 und starte die Docker-Instanz neu.
Der Fehler der vorher sporadisch alle 5-120 Minuten auftrat, kam bis jetzt 36 Stunden nicht mehr vor. Soll es das gewesen sein? Nein, denn bei jeder dieser Fehlermeldungen, kam ja auch die Info, das ein Core-Dump geschrieben worden sein soll. In dem Verzeichnis findet sich aber keiner.
Dafür laufen nun die Logs “voll”.
Ich überlege nun das Debugging wieder zu begrenzen, aber wenn keine Core-Dumps produziert werden, obwohl es so eingestellt ist, wo soll ich dann noch suchen?
Vielleicht hat ja jemand von Euch eine Idee.