OS/2-Problem oder defekte Hardware?

(DE) System, Installation, Konfiguration, Hardware, Treiber, Netzwerk, Virtualisierung, etc.
(EN) System, Installation, Configuration, Hardware, Drivers, Network, Virtualisation, etc.
Antworten
Benutzeravatar
Michaela
Beiträge: 26
Registriert: Di 14. Jan 2020, 11:08
Kontaktdaten:

OS/2-Problem oder defekte Hardware?

Beitrag von Michaela »

Hallo zusammen,

nachdem ArcaOS 5.0.4 auf meinem Notebook ein paar Tage ganz wunderbar lief, fing es vor ein paar Tagen an herumzuzicken: nach einer Weile Netzwerkverkehr (egal ob Firefox, ANPM, FTP oder was sonst) geht die CPU-Last auf nahezu 100 %, lt. TOP ist Prozess 1, Sysinit, mit mindestens 97 % Ursache. Alle anderen Prozesse sind höchstens 2 % (PMShell, TOP). Das System ist noch bedienbar, aber etwas träge, im Netzwerk geht jedoch gar nichts mehr.

Ich hatte zuerst die schon etwas ältere Festplatte im Verdacht, weil mein Haupt-OS/2 Probleme machte, ein Maintenance-OS/2 (ebenfalls ArcaOS 5.0.4) auf einer anderen Partition jedoch zuerst nicht. Smartmontools ergab dann auch mehrfach Pre-failure auf der SSD.

Ich habe dann eine neue Festplatte gekauft, heute eingebaut und ArcaOS 5.0.4 neu installiert, aber die Probleme bestehen weiterhin. Schon bei der Installation in Phase 2 bleibt das System beim Installieren von Firefox hängen, ich muss dann mit CTRL-ALT-DEL neu starten, dann läuft Phase 2 zu Ende durch. Nach der Installation wollte ich mit ANPM die Updates installieren, aber es bleibt ziemlich schnell beim Download hängen, SYSINIT wieder bei 97 % oder mehr, kein weiterer Netzwerkverkehr mehr.

Mein Verdacht: Hardware ist defekt (das Notebook ist etliche Jahre alt, ein Sony Vaio, das damals mit Windows 7 x64 ausgeliefert wurde). Festplatte ist wie gesagt ausgetauscht (weiterhin SSD). RAM ist mit 8 GB mehr als ausreichend vorhanden. Netzwerk läuft über die integrierte LAN-Karte.

ArcaOS 5.0.4 lief auf dem System schon einwandfrei und es ist jetzt frisch installiert, ohne zusätzliche Software, also liegt es wohl eher nicht an dem OS.

Habt Ihr eventuell eine Idee, was die Ursache sein könnte?

Nachtrag: Ich habe jetzt parallel zur ArcaOS ein Ubuntu Linux (64x) installiert (und zur Verwendung des LAN-Chips gezwungen, den auch ArcaOS verwendet) - das läuft bisher stabil.

Update 26.01.2020: Nachdem ich (neben allen anderen bei AN verfügbaren Updates) die aktuelle Version von ANPM (inkl. deutscher Sprachdatei) reinstalliert habe, läuft ArcaOS stabil - erklären kann ich mir das nicht.


Grüße

MIchaela
Zuletzt geändert von Michaela am So 26. Jan 2020, 11:03, insgesamt 2-mal geändert.
Michaela

Meerjungfrau mit einem Faible für OS/2
Benutzeravatar
Michaela
Beiträge: 26
Registriert: Di 14. Jan 2020, 11:08
Kontaktdaten:

Beitrag von Michaela »

Zu früh gefreut...

Hallo zusammen,

nachdem ArcaOS 5.0.4 eine Weile stabil gelaufen war, habe ich eine große JFS-Partition angelegt (Festplatte 120 GB SSD, frei waren 66.464 MB) - und ab dem nächsten Tag (gestern) gab es dann wieder große Probleme, wie vorher beschrieben. Sobald es etwas Netzwerkverkehr gibt (Aufruf des ANPM reicht), geht die CPU-Last (IRQ-Last) auf >85 %, es findet kein Netzwerkverkehr mehr statt, ich kann z.B. meinen Router nicht mehr anpingen, alle Pakete gehen verloren.

Heute habe ich besagte Partition wieder gelöscht, und nun läuft offenbar wieder alles perfekt.

Kann es da einen Zusammenhang geben?


Grüße

Michaela
Michaela

Meerjungfrau mit einem Faible für OS/2
Benutzeravatar
LotharS
Beiträge: 968
Registriert: So 29. Dez 2013, 20:07
Wohnort: Düsseldorf
Kontaktdaten:

Beitrag von LotharS »

Idee habe ich keine... (bin nur virtuell unterwegs).
Aber könntest Du etwas mehr über die verbaute Hardware sagen, insbes. CPU, Grafik ? Hoffe dann findet jemand weiter :)
Benutzeravatar
Michaela
Beiträge: 26
Registriert: Di 14. Jan 2020, 11:08
Kontaktdaten:

Beitrag von Michaela »

Hallo Lothar,

hier die Hardware. Es ist ein Sony Vaio VPCEB1S1E (Notebook).

Intel Core i5 430M 2.26 GHz (Turbo 2.533 GHz)
8GB DDR3-1066
North Bridge: Intel Ironlake-M IMC
South Bridge: Intel Ibex Peak-M HM55
High Definition Audio (Realtek ALC269)
ATI Mobility Radeon HD 5650 1GB GDDR3 (450/790) PCI Express 2.0 x16 @ x16
SANDISK Ultra II 120 GB SSD
Sony Optiarc DVD RW AD-7700H
Atheros AR9285 Wireless Network Adapter
Marvell Yukon 88E8059 PCI-E Gigabit Ethernet Controller
Foxconn T77H114-BCM2070 Bluetooth-Gerät (PAN)

Für die Grafik verwende ich Panorama, da SNAP mit der Auflösung 1366x768 nicht zurechtkommt.

Aufteilung Festplatte:

1. Primär 8 GB Boot JFS ArcaOS 5.0.4 (C:)
2. Logisch 8 GB JFS (D:)
3. Logisch 24 GB JFS (E:)
4. Logisch 4 GB HPFS (F:)
5. Logisch 4 GB Boot JFS ArcaOS 5.0.4 (G:)
6. 66,5 GB frei

AiR Boot Manager ist installiert

An Stelle von 6. war ursprünglich Ubuntu 19.10 installiert, aber das hatte mir die Partitionierung zerschlagen (die Laufwerke D:-F: waren verschwunden, ich musste sie erst mit DFSee zurückholen).


Grüße

Michaela
Michaela

Meerjungfrau mit einem Faible für OS/2
Andi B.
Beiträge: 742
Registriert: Di 24. Dez 2013, 16:40
Kontaktdaten:

Beitrag von Andi B. »

Einen Zusammenhang mit der zusätzlichen JFS Partition, kann ich mir nicht erklären. Ich hab schon so einige Probleme gesehen und auch selbst seit vielen Jahren viele JFS Partitions in verschiedenen Systemen bis >1,5GB in Verwendung. Aber noch nie irgend ein Problem wie "JFS Partition beeinflusst Netzwerkverkehr" gehabt bzw. auch noch nie davon gelesen.

Was mir einfällt, hast du ev. Hyperthreading in Bios nicht deaktiviert? Und zweitens, auf einem System mit Marvel Netzwerkchip hatte ich auch immer mal wieder sporadische Problem. Also Netzwerk lief nur eine zeitlang und dann ging nichts mehr. Wenn ich allerdings mache Programme gestartet habe, dann lief das Netzwerk auch mit dem Marvell Chip. Da es sich um einen Standrechner handelt, hab ich eine Netzwerkkarte mit Realtek Chip eingebaut und seitdem läuft das System zuverlässig. Ich vermute irgendeinen Power Down Mode mit dem Marvell Chip und ACPI und .....

So dumm es klingt, aber du kannst ja ausprobieren im Autostart Ordner oder unmittelbar nach dem Booten, z.B. DFSee zu starten. Ich verstehe zwar den Zusammenhang nicht (außer ev. mehr Auslastung des Systems), aber bei meinem System konnte ich damit den Marvell Netzwerkchip am laufen halten. Ein CLI Fenster mit Dauer-Ping hat nicht gereicht. Auch irgendwelche Netzwerk und Powereinstellungen im BIOS könnten einen Unterschied machen. Aber wie gesagt, alles weit hergeholt. Für mich aber immer noch schlüssiger, als der Zusammenhang mit der zusätzlichen JFS Partition.
Benutzeravatar
Michaela
Beiträge: 26
Registriert: Di 14. Jan 2020, 11:08
Kontaktdaten:

Beitrag von Michaela »

Hallo und danke für die Hinweise,

einen Zusammenhang mit der JFS-Partition gibt es tatsächlich nicht, da habe ich mich geirrt.

Ich hatte dummerweise vergessen, dass ich zwei Partitionen angelegt hatte: eine 2 GB große HPFS-Partition (für die Programme, die mit großen Partitionen nicht zurechtkommen, einfach für den Fall der Fälle) und eine 64,5 GB große JFS-Partition (der Rest des freien Speichers). Nachdem mir das wieder eingefallen ist, habe ich die gleiche Partitionierung wieder hergestellt (8 GB JFS, 8 GB JFS, 24 GB JFS, 4 GB HPFS, 4 GB JFS, 2 GB HPFS, 64,5 GB JFS).

Die kleine HPFS-Partition ist der Übeltäter. Existiert sie, gibt es (nach einem Neustart) reproduzierbar Probleme beim Netzwerkverkehr. Bleibt der Platz frei oder belege ich die kompletten 66,5 GB mit einer JFS-Partition, gibt es keine Probleme. Erstelle ich die Partition und formatiere sie mit HPFS, habe ich keine Probleme, bis ich den Rechner neu starte. Erst nach dem Neustart beginnen die Probleme (mit beiden installierten ArcaOSen). Warum die kleine HPFS-Partition Probleme macht, kann ich mir nicht erklären. Aber der Fehler ist auf meinem System reproduzierbar.

Hyperthreading kann ich im BIOS übrigens nicht aktivieren, da es eine solche Option nicht gibt (das BIOS ist sehr sparsam mit Einstellungsmöglichkeiten).


Grüße

Michaela
Michaela

Meerjungfrau mit einem Faible für OS/2
Benutzeravatar
Michaela
Beiträge: 26
Registriert: Di 14. Jan 2020, 11:08
Kontaktdaten:

Beitrag von Michaela »

Hallo zusammen,

für die, die es interessiert:

Ich habe noch einmal herumgespielt. Die 66,5 GB große JFS-Partition gelöscht und eine 2 GB und eine 64,5 GB große Partition angelegt. Erstere nicht formatiert, zweitere als JFS. Bis zum Neustart alles okay.

Nach einem Neustart bricht der Netzwerkverkehr schnell wieder zusammen (es gehen rund 80 Pings an den Router raus und kommen zurück, danach gehen alle Pings verloren).

Also die kleine Partition wieder gelöscht - nach einem Neustart ist der Spuk wieder vorbei. Es liegt also nicht daran, dass diese Partition mit HPFS partitioniert ist, sondern einfach daran, dass sie existiert. Bleiben die 2 GB hingegen frei oder erstelle ich eine Partition über die ganzen 66,5 GB, ist alles in Ordnung.

Möglicherweise hängt es damit zusammen, dass zwischenzeitlich auf den 66,5 GB Ubuntu installiert war und während der Installation (obwohl ich die Installations-Partition für Ubuntu vorher von ArcaOS aus erzeugt hatte) an der Partition Table herumgepfuscht hat. Das hatte ich zwar in DFSee repariert (durch die Ubuntu-Installation waren die nicht startfähigen LVM-Laufwerke verschwunden, nur die startfähigen Laufwerke waren für ArcaOS noch sichtbar), aber anders kann ich mir das nicht erklären.


Grüße

Michaela
Michaela

Meerjungfrau mit einem Faible für OS/2
Andi B.
Beiträge: 742
Registriert: Di 24. Dez 2013, 16:40
Kontaktdaten:

Beitrag von Andi B. »

Ich verstehe es zwar nicht und dass ist alles sehr komisch. Aber vielleicht versuchst du mal umittelbar nach dem Start, solange die Pings noch laufen, DFSee zu starten. Ich habe ein DFSee Objekt auf der Arbeitsoberfläche bzw. im xcenter und sobald die WPS hochgefahren ist, hab ich mit Klick (Doppel-Klick) DFSee gestartet und Enter gedrückt, damit der Anfangsdialog verschwindet und die Partitionübersicht angezeigt wurde. Bei meinem "komischen" System lief das Netzwerk dann meist (immer?) länger, auch mit dem Marvell Treiber.

Wie gesagt, ich verstehe absolut nicht den Zusammenhang zwischen Partitions und dem LAN Treiber und ich denke noch immer, "nur" der MultiMac Marvell Treiber hat ein Problem. Aber wenn du die gleichen Beobachtungen wie ich mit deinem Rechner nachvollziehen kannst, dann könnte AN da ev. weiterforschen.
Andi B.
Beiträge: 742
Registriert: Di 24. Dez 2013, 16:40
Kontaktdaten:

Beitrag von Andi B. »

Andere Idee - funktioniert es immer bzw. nur nach einem Neustart? Also komplett ausschalten, ev. sogar Batterie raus und dann testen. Das manche Sachen nach einem Reboot (Neustart egal von welchem OS) nicht 100% gleich initialisiert werden im Vergleich zu komplett aus/ein, ist bei manchen Systemen ein bekanntes Problem. Auch dass sich manche Hardware unterschiedlich verhält, wenn vorher z.B. Win lief und von dort nach "Neustart" ein anderes OS bootet.
erdmann
Beiträge: 594
Registriert: Mo 4. Jan 2016, 14:36

Beitrag von erdmann »

Ich würde etwas anderes vermuten:
die Platte hat Defekte Sektoren und zwar genau an der Stelle die von der Partition belegt ist (oder auch nicht).
Das führt dann beim Zugriff auf endlose retries die natürlich Interruptperformance fressen. Und dies geht dann zu Lasten des Netzwerktreibers der eventuell den gleiche Interrupt teilt (Mal prüfen).
Wenn sich die ganze Partition über diesen problematischen Bereich erstreckt liegen da dann vielleicht eben keine FS kritischen Strukturen auf die häufig zugegriffen wird (und deshalb gibt's da ggw. keine Probleme, langfristig vielleicht aber schon).
Benutzeravatar
Michaela
Beiträge: 26
Registriert: Di 14. Jan 2020, 11:08
Kontaktdaten:

Beitrag von Michaela »

Hallo Andi,

das mit DFSee werde ich testen. Was den Neustart betrifft: auf dem Rechner ist nur ArcaOS installiert, kein Windows, kein Linux. Aber Akku entfernen könnte durchaus einen Versuch wert sein.

Ergebnis: Auch mit sofort gestartetem DFSee werden nur 102 Pings beantwortet, die danach gehen verloren. Akku entfernen und Kaltstart ändert auch nichts.

Hallo Lars,

Smartmontools sagt, die SSD sei in Ordnung (mit dem Long-Test). Sie ist auch ganz neu, da die alte SSD Ausfallerscheinungen hatte. Die Netwerkkarte hat einen eigenen IRQ, der lt. Hardware Manager sonst von keinem Gerät belegt wird.

Update: Ich habe DFSee darauf schauen lassen, werde aber aus den Ergebnissen nicht schlau. Was mir auffällt: DFSee zeigt die betreffende Partition als "Related: Linux" an, nicht wie alle anderen Partitionen als "IBM 4.50".

Der Scan nach Bad Sectors auf der Partition ergibt: "Msg: 245 = 00f5 : SN exceeds current limit als Lsn: 0x03e8200 = PSN: 0x061ab827. ReadWrite Store A: (...) RC:245 = 0xF5 : 0x00000000 up=0x00000059 this=0x00000000 Base=0x05DC3627"



Grüße

Michaela
Zuletzt geändert von Michaela am Fr 31. Jan 2020, 14:08, insgesamt 1-mal geändert.
Michaela

Meerjungfrau mit einem Faible für OS/2
Antworten