Final behoben: (Teil-)Ausfall der bwCloud Standort Freiburg
Update 12.5.: Der Ausfall sollte final behoben sein und VMs wieder starten. User sollten dieses bei Bedarf selbst über das Dash-Board antriggern.
Update 13.5.: Wo das nicht möglich sein könnte, erfolgt eine Reparatur des betroffenen Filesystems.<br><br>
Behoben: Damit ist die bwCloud am Standort Freiburg wieder nutzbar. Es gab einen Ausfall einer NVMe des Ceph-Pools, durch das automatische Rebalancing kam es zu einem weiteren Ausfall. Im Moment ist das System daher mit sich selbst beschäftigt. Warum die Komponente ausgefallen bzw. für das System nicht sichtbar ist, ist noch unklar und erfordert evtl. einen Hardwarereset bzw. Tausch, was erst ab Montag möglich sein wird.<br><br>Die Untersuchungen der Ursache und der evtl. notwendige Ausbau sind erfolgt. Ein Tausch wurde bereits eingeleitet. Bis dahin ist mit verschlechterter Caching-Performance zu rechnen.<br><br>Es gibt noch ein unklares Verhalten des Ceph2-Servers (einer von vieren), dessen Präsenz dafür sorgen kann, dass bestimmte Prozesse "hängen". Ein Neustart des Systems "befreit" diese. Hier konnte ein Hardware-Reset (Strom weg) eine rogue Netzwerkkarte wieder so resetten, dass keine Paketstürme mehr auftreten und Folgeprobleme verursachen.