[Comp.Sci.Dept, Utrecht] Note from archiver<at>cs.uu.nl: This page is part of a big collection of Usenet postings, archived here for your convenience. For matters concerning the content of this page, please contact its author(s); use the source, if all else fails. For matters concerning the archive as a whole, please refer to the archive description or contact the archiver.

Subject: <2005-03-22> CPU+Mainboard FAQ - Kapitel 10/14 - Fehlersuche

This article was archived around: 3 Sep 2012 02:00:08 +0200

All FAQs in Directory: de/comp/hardware/cpu+mainboard
All FAQs posted in: de.comp.hardware.cpu+mainboard.misc, de.comp.hardware.cpu+mainboard.amd, de.comp.hardware.cpu+mainboard.intel, de.comp.hardware.cpu+mainboard.uebertakten
Source: Usenet Version


Archive-name: de/comp/hardware/cpu+mainboard/kapitel_10 Posting-frequency: monthly Last-modified: 2005-03-22 URL: http://dch-faq.de/kap10.html Disclaimer: Approval for *.answers is based on form, not content.
10. Fehlersuche =============== In den seltensten Fällen laufen selbst zusammengestellte Rechner auf Anhieb ohne Probleme. Das betrifft sowohl den durchschnittlich gebildeten Laien (juristisch für "DAU") als auch den Hobby-Bastler oder sogar den professionellen Systemintegrator. Selbst bei neu erworbenen Komplettsystemen ist man nicht vor Problemen sicher. Die Gründe dafür sind so vielfältig, dass es weder durchschlagende Patentrezepte noch FAQs gibt, die das auf die Schnelle ändern. Die verwendete Hardware und Software ist mitlerweile so komplex, dass es beinahe unmöglich erscheint, kompetenten und wirklich helfenden Rat zu bekommen. Auch wir FAQ´ler können diesen Missstand selbstverständlich nicht beheben. Trotzdem wollen wir die User nicht ganz im Regen stehen lassen, und wenigstens einige Tips weitergeben, wie man Problemen auf die Spur kommen kann. Eine Garantie gibt es dafür natürlich nie. Die Fehlersuche dieser FAQ bedient themengemäss beinahe ausschliesslich die Hardware; lediglich in Kapitel 11 findet ein kleiner Exkurs zum Thema "Treiber" statt. In den einzelnen Kapiteln befinden sich bereits häufig Anleitungen zur Fehlersuche, auf die hiermit nocheinmal nachträglich hingewiesen werden soll. 10.1 Fehlererkennung ==================== Bevor man einen Fehler beheben kann, muss man ersteinmal wissen, dass überhaupt ein Fehler vorliegt. Wie so vieles hört sich dies trivial an; in der Praxis gibt es allerdings Scharen von Usern, die vielleicht schon sehr lange auf Fehlern sitzen und/oder gar nicht wissen, dass sie einen Fehler im System haben ("Unwissenheit ist etwas Kostbares" - The Matrix). Das heisst jedoch nicht, dass man sein System so lange auf den Kopf stellen soll, bis man endlich einen Fehler gefunden (oder damit provoziert) hat - wer keine Probleme hat muss nicht unbedingt danach suchen :-). Das Hauptproblem bei auftretenden Fehlern ist es, sie richtig einzuordnen. Grundsätzlich gilt: Ein Fehler ist kein Fehler. Das heisst soviel wie: Wenn das System mal abstürzt oder hängenbleibt ist das kein Anzeichen dafür, dass wirklich ein Defekt im eigentlichen Sinne vorliegt. Häufig handelt es sich bei nicht wiederkehrenden Fehlern um schlampig programmierte Software oder eben treiberseitige Probleme. Häufig sind auch solche Instabilitäten in den Griff zu bekommen; hier sei auf die Newsgruppen der Hierarchie de.comm.software.ALL und de.comp.os.ALL verwiesen. Speziell zu Microsoft Windows 9x und NT gibt es bereits hilfreiche FAQs, wenn es um das Lösen von Problemen geht: http://www.winfaq.de, http://www.wintotal.de und http://www.windows2000helpline.de seien hier nur stellvertretend für die Vielzahl an Webseiten genannt, die sich mit den Betriebssystemen auseinandersetzen. Für Hardware'ler richtig interessant wird es eigentlich erst, wenn Fehler gehäuft oder gar reproduzierbar auftreten. Hat man Softwarefehler zum grössten Teil bzw. so weit es geht ausgemerzt, wird es Zeit über hardwareseitige Fehlerquellen nachzudenken, derer es sehr viele gibt. In dieser FAQ soll das Hauptaugenmerk auf die systematische Fehlereingrenzung gelegt werden. 10.2 Fehlereingrenzung ====================== Hat man einen Fehler vorliegen, der häufiger auftritt, muss man sich Gedanken um die Fehlerursache machen. Zum Auffinden des Fehlers gibt es 3 Strategien: 1. Intuition: Haben wohl nur die Gewohnheitsschrauber, für den Laien also nicht von Nutzen - es sei denn, man hat grade einen solchen zur Hand :-) 2. Random choice: Man sucht wild drauf los, ohne sich grosse Gedanken um eine Systematik zu machen. Nach den Gesetzen der Statistik kann man das Problem extrem schnell finden - oder aber daran für immer verzweifeln. 3. Systematische Fehlersuche: Wenn überhaupt wohl die sicherste Methode, um einen Fehler _wirklich_ zu finden, und das in vertretbarer Zeit. Falls sich der Leser der FAQ jetzt für Punkt 3 entschieden hat, so soll in den folgenden Punkten aufgezeigt werden, wie man vorgehen kann. 10.2.1 Die Minimalkonfiguration =============================== Eine effektive Fehlereingrenzung fängt mit dem Herstellen der sog. Minimalkonfiguration an. Hier wird der Rechner von allem befreit, was für den blossen Betrieb nicht notwendig ist. Auf dem Mainboard sollte lediglich die CPU samt Kühler und die Grafikkarte installiert sein - nicht zu vergessen der Stecker für die Stromzufuhr. An das Mainboard angeschlossen werden nur noch die Tastatur und der Monitor. Alle Onboard-Komponenten sollten via Jumper oder BIOS abgeschaltet werden. Auch die Laufwerke sollten auf ein absolutes Minimum reduziert werden oder komplett abgeklemmt werden, um einen Fehler z.B. der Bootplatte feststellen zu können. Alle Einstellungen, die zum Übertakten dienen, sollten abgestellt werden, der Speicher sollte mit den langsamsten Timings angesprochen werden. Falls mehrere Speicherbausteine im System sind, sollte man alle bis auf ein Modul herausnehmen (bis auf Systeme, die auf mehrere Bausteine bestehen, wie z.B. die 2-Kanal-Rambus Chipsätze i840, i850(E) und i860). Man kann sogar die Tastatur (bei abgeschaltetem PC) entfernen. Dann sollte nur eine Fehlermeldung des BIOS erscheinen. Der so konfigurierte PC sollte nun zumindest bis ins BIOS kommen. Läuft auch das Betriebssystem an (bei installierten Laufwerken), kann man sich mit den deinstallierten Komponenten beschäftigen und somit in Kap. 10.2.2 weiterlesen. Kommt man nicht in das BIOS oder das Betriebssystem, kann es noch mehrere Fehlermöglichkeiten geben. Um Fehler beim RAM, BIOS oder der CPU (inkl. Kühlung und Übertakten) zu erkennen, sei auf die entsprechenden Kapitel der FAQ verwiesen (CPU: Kap. 3, Kühlung: Kap. 4, Übertakten: Kap 9, BIOS: Kap. 7, RAM: Kap. 8). Ein weiterer potentieller Störenfried in der Minimalkonfiguration ist die AGP- bzw. PCI-Grafikkarte. Da defekte AGP- und PCI-Karten den kompletten PCI-Bus stören können, sind die Symptome für ein defektes Gerät äusserst unterschiedlich. Auch hier hilft häufig eine alte oder geliehene, fehlerfreie Grafikkarte. Wer noch einen ISA-Slot auf seinem Board besitzt, sollte eine funktionierende ISA-Grafikkarte einbauen, um Konflikte mit dem PCI-Bus komplett ausschliessen zu können. Ist der Fehler immer noch nicht zu finden, wird die Diagnose zugegebenermassen schwierig. Bevor man aber ein Defekt des Motherboards als Möglichkeit in Betracht zieht (was sehr wohl möglich ist), sollte man nochmals sämtliche Steckverbindungen gründlich überprüfen. Im Defektfall aber lässt sich der Fehler nur durch einen qualifizierten Fachmann herausfinden. 10.2.2 Das Netzteil =================== Eine weitere sehr häufige Fehlerquelle sind die Netzteile (NT). Vor allem moderne CPUs brauchen sehr viel Strom, und in aufgerüsteten PCs stecken meist nur alte und/oder zu schwache Netzteile. Beim Netzteil lohnt es sich nicht, irgendwelche Kompromisse einzugehen. Auch neue (oder neuwertige) 300W Netzteile können auf den einzelnen Leitungen zu schwach sein. Deswegen sollte man immer auf Marken- Netzteile (Enermax, ChannelWell, Fortron etc.) wert legen. Marken-NT halten sie sich an die Vorgaben von AMD, auf der +3.3V-Leitung mindestens 20A und auf der +5V-Leitung mindestens 30A liefern zu können. Netzteile, die diese Spezifikation nicht erfüllen, sollte man gar nicht mehr neu erstehen. Neuere Systeme (AMD Athlon 64 und Opteron sowie Intel Pentium 4) beziehen den Strom für die CPU über die 12V-Leitung, weshalb auch hier die Stromstärken nicht zu gering bemessen sein sollten. Dies gilt insbesondere für Systeme, die 2 PCIe Grafikkarten (SLI) aufnehmen. Wer sich heutzutage ein neues NT kauft, sollte sich daher überlegen, folgende Eckdaten einzuhalten: 28A auf 3.3V, 30A auf 5V und 15A auf 12V. Diese Konfiguration wird von AMD als (unverbindliches) Beispiel angegeben - siehe: http://www.amd.com/us-en/Processors/TechnicalResources/0,,30_182_869_4348^4358,00.htm Für SLI-Systeme sollten sogar 18A über die 12V-Schiene fliessen können. Nur wer sehr viele Laufwerke oder mehrere CPUs hat, braucht eventuell noch stärkere Netzteile. Aber nicht nur die Belastbarkeit ist entscheidend: Beim Strom gibt es auch Schwankungen und Rauschen der Signale, was sich auf alle Komponenten auswirkt, da ja alle (evtl. über den Umweg Mainboard) vom NT bedient werden. Auch deshalb ist ein Marken-NT anzuraten. Hinzu kommt der häufig schlechte Wirkungsgrad von Billig-Netzteilen, die dann hauptsächlich eins produzieren: Wärme. Ausserdem sollte man sich auf den Webseiten der CPU-Hersteller kundig machen (wie z.B. bei AMD unter http://www1.amd.com/athlon/config), welche Netzteile dort empfolen werden. In der Zeitschrift c't finden sich gleich mehrere Tests zum Thema Netzteile, so z.B. in c't 10/01, Seite 196ff oder auch in der c't 13/00, Seite 100ff. Auch dort wird darauf hingewiesen, dass schlechte Netzteile sehr häufig der Grund für Fehler sind. Bei älteren Systemen, die noch nicht über den 4-poligen ATX12V-Power-Stecker versorgt werden, ist die 12V-Schiene oft unkritisch. Sämtliche Laufwerke, welche den "großen" Power-Stecker haben, werden durch sie versorgt. Der kleine Power-Stecker, wie er bei Floppys zu finden ist, bringt zusätzlich noch eine 5V-Ader mit. Hat man keinen Server mit sehr hoher Anzahl von Laufwerken, ist es auch für einfache Netzteile kein Problem, diese Laufwerke ausreichend zu versorgen. Seit der ATX12V-Spezifikation, wie sie von Intel für den Pentium 4 vorgestellt wird, wird aber auch das Motherboard samt CPU verstärkt mit 12V über einen zusätzlichen 4-poligen (ATX12V-) Stecker versorgt, da die maximal abgebbare Leistung an 3.3V und 5V kaum mehr ausreicht, um moderne Intel (Pentium 4, XEON) oder AMD-CPUs (Athlon 64, Opteron) zu betreiben. Bis ATX 2.1 besaß der alte ATX Main-Power-Stecker (20 Pin) zum Mainboard nur eine 12V-Leitung, was sich als unzureichend erwiesen hat. Mit ATX 2.2 hat der Main-Power-Stecker zwar 24 Pins und nun zwei 12V-Leitungen, trotzdem wird der 4-polige 12V-Stecker noch für die CPU- und Mainboard-Lasten verwendet. Der zusätzliche Pin im 24-poligen ATX-Stecker ist vornehmlich für den Leistungsbedarf stromhungriger PCI-Express-Karten gedacht, die sich bis zu 75W an Leistungsaufnahme genehmigen dürfen. Die Stecker von ATX 2.2 passen mechanisch auch auf den neuen BTX-Standard, der in der Version 1.0 vorliegt. Eine Übersicht, in welchem Bereich die Spannungen und Ströme laut ATX- und BTX-Spezifikation (Version 2.2 und 1.0, zu finden unter http://www.formfactors.org/) liegen sollten, gibt folgende Tabelle: Ausgang | Toleranz | U(min)|U(norm)| U(max)| I(min)|I(norm)| I(peak) | [%] | [V] | [V] | [V] | [A] | [A] | [A] ==========+==========+=======+=======+=======+=======+=======+======== + 12 V | +/- 5%(1)|+11.40 |+12.00 |+12.60 | 0.0 | 12.0 | 13.0 ----------+----------+-------+-------+-------+-------+-------+-------- + 5 V | +/- 5% | +4.75 | +5.00 | +5.25 | 1.0 | 30.0 | - ----------+----------+-------+-------+-------+-------+-------+-------- +3.3 V | +/- 5% | +3.14 | +3.30 | +3.47 | 0.3 | 20.0 | - ----------+----------+-------+-------+-------+-------+-------+-------- - 5 V (2)| +/-10% | -4.50 | -5.00 | -5.50 | 0.0 | -0.3 | - ----------+----------+-------+-------+-------+-------+-------+-------- - 12 V | +/-10% |-10.80 |-12.00 |-13.20 | 0.0 | -0.8 | - ----------+----------+-------+-------+-------+-------+-------+-------- + 5 V | +/- 5% | +4.75 | +5.00 | +5.25 | 0.0 | 1.5 | 2.5 (Standby) | | | | | | | ----------+----------+-------+-------+-------+-------+-------+-------- (1) Bei Maximallast darf die +12V-Schiene um bis zu +/- 10% schwanken. (2) Ab ATX 2.2 darf die -5 V Leitung wegfallen und ist nur noch optional. Die Tabelle stellt nur eine Beispielkonfiguration dar, mit der evtl. High-End-Systeme mit 2 PCIe Grafikkarten nicht versorgt werden können. Das Netzteil als Ursache zu identifizieren ist nicht trivial, dies geht i.d.R. nur mit entsprechender Messtechnik. Lediglich die Funktionen des Hardwaremonitoring können durch schwankende oder zu niedrig liegende Spannungen auf einen Defekt des Netzteiles aufmerksam machen. Gibt es hier keine Anzeichen für Probleme, bleibt einem der Gang zum Fachmann nur dann erspart, wenn man leihweise ein Ersatznetzteil zur Verfügung hat und einbauen kann. Wenn man nun ein Netzteil besitzt, welches überall Empfehlungen bekommen hat, aber trotzdem das Netzteil in Verdacht hat, sollte man im BIOS oder per Monitoring-Software die Spannungen (vor allem +3.3V und +5V) auf Stabilität beobachten. Sinkt eine Spannung stark ab, ist dies ein sicheres Zeichen für ein Problem. Dies kann einerseits eine Überlastung des Netzeils bedeuten oder andererseits auf Kontaktprobleme am ATX-Motherboard-Stecker hindeuten. Hier sollte man (bei abgeschaltetem Rechner) den Stecker überprüfen. Sollte er z.B. aussergewöhnlich warm sein, ist das ein sicheres Zeichen für ein Kontakproblem. Die Kontakte dürfen auf keinen Fall korrodiert oder der Stecker schon angeschmort sein. Leider muss an dieser Stelle aber auch angemerkt werden, dass die Angaben der Mainboard-Messwerte oft unzuverlässig sind; hier sind durchaus Fehler von über 1% im Bereich des möglichen. Um Strom und Spannung exakt zu messen, bedarf es daher ggf. geeigneter externer Messgeräte (z.B. Multimeter etc.), deren Handhabung ein Fachmann übernehmen sollte. 10.2.3 Wiedereinbau der Komponenten =================================== Sind in der Minimalkonfiguration keine Fehler mehr aufgetreten, kann man mit dem Wiedereinbau der einzelnen Komponenten beginnen. Zunächst sollten aber die Onboard-Komponenten (Controler, Sound, Modem, LAN etc.) wieder in Betrieb genommen werden, da auch diese durchaus Fehler verursachen können. Danach sollten eventuelle Controller und die daran angeschlossenen Laufwerke installiert werden. Treten hier Probleme auf, kann man die Onboard-Schnittstellen wieder abschalten, um zu sehen, ob es hier Unverträglichkeiten und Konflikte gibt. Ist dies nicht der Fall, sollten die Laufwerke überprüft und der Controller testweise ausgetauscht werden. Treten keine Probleme auf, kann man die weiteren Steckkarten einsetzen. Wichtig ist, dass der Einbau der Karten nicht wahllos, sondern wohl durchdacht geschieht. Die Steckkarten sind so anzuordnen, dass Resourcen-Konflikte so weit wie möglich vermieden werden. Liegen solche Resourcen-Konflikte vor, sei hier auf das Kapitel über IRQs (Kap. 6) verwiesen. Als Faustregel sollte man "unwichtigere" Komponenten zuletzt einbauen. (Also: Controler zuerst - Sound- und TV-Karten zuletzt). Auch sollte man lieber vorsichtig und langsam vorgehen - d.h.: Immer nur eine Komponente - auch wenn der Fehler offensichtlich nicht damit zusammen zu hängen scheint. Auch sollte man stets das Betriebssystem komplett booten und die "neue" Komponente vollständig installieren. In der Regel lässt sich durch den nach und nach erfolgenden Einbau der Karten der "Übeltäter" ausfindig machen. Manchmal reicht zum Lösen eines Problems z.B. ein Wechsel des gewählten Slots, in anderen Fällen kommt man nicht um den Austausch der Komponente herum. Bei Defekten vor dem Ablauf eines halben Jahres nach Kauf des Gerätes kann man den Händler um Reparatur oder Wandlung bitten, danach greift ggf. noch die Garantie der Hersteller. Ist trotzdem der Fehler nicht gefunden, sollte man sehr genau beobachten, wann und wie ein Fehler auftritt. Da niemand perfekt ist, hilft dann oft die Hilfe eines (hardwarekundigen) Bekannten oder eine Anfrage in der geeigneten Newsgroup. Merke: Umso genauer das Problem beschrieben werden kann, desto wahrscheinlicher ist es, dass ein anderer die richtigen Schlüsse ziehen und helfen kann. 10.3 Oft auftretende Fehler =========================== In den vorangegangenen Kapiteln wurden einige grundsätzliche Lösungsprinzipien vorgestellt. Hier soll es nun etwas tiefer ins Detail gehen und einige oft auftretende Fehler sollen beleuchtet werden. Eines vorweg: Die Anzahl von möglichen Fehlern ist gradezu erdrückend groß, sodass hier wirklich nur exemplarisch einige Dinge aufgeführt werden können. 10.3.1 Der PC rührt sich nicht ============================== Sollte der PC beim Drücken des Power-Tasters keinerlei Regung zeigen, so könnten folgende Probleme aufgetreten sein: 10.3.1.1 Eine wichtige Komponente ist nicht richtig eingesteckt =============================================================== Rüste unbedingt auf ein Minimalsystem um, wie in Kapitel 10.2.1 beschrieben. Überprüfe alle Steck-Verbindungen. Besonderes Augenmerk ist auf den korrekten Sitz der CPU zu legen. Die CPU muss fest im Sockel sitzen und der Kühlkörper muss plan aufliegen. Dabei darf kein schräger Druck ausgeübt werden - besonders nicht durch den Kühlkörper, denn die CPU könnte zerbrechen. RAM und Grafikkarte sollten tief im Sockel sitzen. Es sollte ein Geräusch des Einrastens zu hören sein. Bei der Grafikkarte ist darauf zu achten, dass die abgewinkelte obere Kante der Slotblende nicht verhindert, dass die Grafikkarte tiefer in den Slot rutschen kann. 10.3.1.2 Es liegt kein Lüfter-Tacho-Signal an ============================================= Einige Motherboards verlangen nach einem Tacho-Signal des CPU-Lüfters, damit sie davon ausgehen können, dass er aktiv ist. Hier ist darauf zu achten, dass der korrekte Lüfter-Anschluss auf dem Motherboard verwendet wurde (also der CPU-Lüfter-Anschluss für den CPU-Lüfter und nicht etwa ein Gehäuse-Lüfter-Anschluss). Es gibt Lüfter, die kein Tacho-Signal liefern. Hier muss man zwangsweise auf einen Lüfter umsteigen, der dies kann. Ein Indiz(!), dass der Lüfter ein Tacho-Signal liefern kann, ist das Vorhandensein von 3 und nicht nur von 2 Versorgungskabeln. Ausserdem sollte man sich vor dem Lüftereinbau vorgewissern, dass der Lüfter nicht mehr Strom zieht, als das Board liefern kann. Hier hilft ein Blick ins Handbuch weiter. 10.3.1.3 Es gibt Probleme beim Netzteil ======================================= Der korrekte Sitz des ATX-Power-Steckers auf dem Mainboard ist zu prüfen. Weiterhin sollte das Netzteil die Mindestanforderungen erfüllen (die in Kapitel 10.2.1 genannt wurden), damit man davon ausgehen kann, dass die Last nicht zu einer Notabschaltung führt. Selbstverständlich sollte auch der echte Power-Schalter am Netzteil eingeschaltet sein ;-). Läuft das Netzteil nicht an, so sollte man sich vergewissern, dass es überhaupt funktioniert. Am sichersten ist man, wenn man ein garantiert funktionierendes Netzteil z.B. von einem Bekannten leihweise bekommen könnte. Hartgesottene Bastler(!) können auch mal versuchen beim Netzteil _ohne_ jegliche Last die Power_On_Leitung mit Masse dauerhaft zu brücken (Pin 14 und z.B. Pin 15). Allen anderen ist davon besser abzuraten. 10.3.1.4 Gestern ging er noch... ================================ Oft ist es Dreck oder ein Anstossen am PC (nach einem kleinen Transport z.B.), der den Kontakt von Bauteilen zunichte macht. Lösungsansatz: Alles raus - Dreck ausblasen - alles wieder rein. Netzteile bieten oft einen gewissen Überspannungsschutz. Sollte also eine Überspannung zur Notabschaltung des Netzteiles führen, dann wird das Netzteil beim folgenden Versuch, einzuschalten nicht starten. Hier hilft: Warten, bis die Sicherung abgekühlt ist und echte Trennung des Netzteiles von der Versorgungsspannung. Ist der Rechner etwas älter (und man hat keine Garantier mehr darauf), so kann der _versierte_ Bastler auch mal das Netzteil öffnen (Natürlich nur bei vollständiger Trennung vom Netz!), um nachzusehen, ob evtl. Staub zu einem Kurzschluss führt, ein Bauteil "ungesund" oder verschmort aussieht oder eine Schmelzsicherung zerstört wurde. Allen anderen Bastlern ist anzuraten, testweise ein anderes Netzteil zu verwenden. 10.3.1.5 Der Rechner will erst angewärmt werden =============================================== Bei diesem verzwickten Problem hat sich bis jetzt noch keine eindeutige Usache herauskristallisiert. Ein paar Lösungsansätze sind: - Kalte Lötstelle: Wenn man nicht mit einer Lupe akribisch danach sucht, wird man selten eine Chance haben, eine solche kalte Lötstelle zu finden - es gibt einfach zu viele Möglichkeiten. - Kontaktprobleme in Verbindung mit Verschmutzung: Hier hilft nur eine komplette Demontage und ein Ausblasen des Staubes. - Defektes Netzteil: Es wurde davon berichtet, dass bei einem Netzteil, dessen Elektrolyt-Kondensatoren geplatzt und ausgelaufen waren, obiges Fehlerbild auftrat. - Es gibt Boards, wo die Elektrolyt-Kondensatoren zu heiß werden. Vermehrt wurde diese bei ABIT-Motherboards mit Jackson-Kondensatoren beobachtet, wenn diese non-stop über mehrere Monate laufen. Meist beginnt sich das Fehlerbild langsam zu zeigen. Oft sind Abstürze die ersten Anzeichen und später muss der PC mit untertaktetem FSB angewärmt werden. (Diese Untertaktung hat den Sinn, dass dann weniger Strom fließt und die Kondensatoren weniger belastet werden.) 10.3.1.6 Defekte Kondensatoren ============================== Im Netzteil und auf dem Motherboards sind zahlreiche Kondensatoren verbaut, die meist zur Regelung der Versorgungsspannung benötigt werden. Durch die recht beachtlichen Ströme, die in PCs fließen, sind diese Bauteile hohen Belastungen ausgesetzt. Weiterhin führt Hitze zu einer schnelleren Alterung dieser Kondensatoren. Immer wieder sparen die Hersteller von Netzteilen und Motherboards bei den Kondensatoren, sodass es nach längerer Betriebszeit dazu kommt, dass die Kondensatoren eine Beule bekommen, reißen und das Elektrolyt ausläuft oder gar explosionsartig platzen. Die praktischen Resultate derartiger Defekte sind * Totalschaden (des Netzteil / Motherboard läßt sich nicht starten) * schlechtes Startverhalten (Kapitel 10.3.1.5) * sporadische Abstürze (besonders, wenn starke Lastwechsel auftreten, z.B. wenn die CPU aus dem Ruhezustand (HLT) aufwacht) Die Lösungen für das Problem sind in erster Linie das Geltendmachen von Garantieansprüchen oder der komplette Austasuch der Komponente. Versierte(!) Bastler können auch zum Lötkolben greifen und ein Ersatz-Kondensator statt des defekten einlöten. Dabei ist darauf zu achten, dass der Ersatz-Kondensator schaltfest ist, Temperaturen bis etwa 100°C verträgt und mindestens die selbe Kapazität hat. (Eine geringfügig höhere Kapazität als der Original-Kondensator soll meist kein Problem darstellen). Wenn noch die komplette Modellbezeichnung des Original-Kondensators zu erkennen ist, liefert diese gute Richtwerte. Da defekte Kondensatoren immer öfter auftreten, hat sich auch die c't mit diesem Problem beschäftigt und in c't 21/03 S. 216ff einen ausführlichen Artikel dazu veröffentlicht, der sich zu lesen lohnt. 10.3.2 Das BIOS erscheint, aber das Betriebssystem bootet nicht =============================================================== Zu allererst sollte man im BIOS die BIOS-Defaults laden. Hier handelt es sich um die sicherste (und langsamste) Einstellung, die der Hersteller vorsieht. (Später, bei erfolgreicher Lösung des Problems sind die Setup-Defaults zu bevorzugen.) Zusätzlich sollte man die RAM-Timings manuell auf die langsamste Einstellung (3-3-3) setzen. Es könnte ja sein, dass der RAM falsche Angaben über seine eigenen Leistungen macht (SPD-EEPROM falsch programmiert) und das BIOS ihn somit zu schnell betreibt. Eine weitere Möglichkeit bietet sich, wenn man den CPU-Multiplikator herunter setzt, sofern möglich (bei ungelockten CPUs). Damit untertaktet man die CPU und sollte Gewissheit haben, dass sie stabil läuft. Alternativ setzt man den FrontSideBus herunter. Grafikkarten sollten im AGP 1x - Modus betrieben werden, AGP Fastwrites sollte disabled sein. Zu überprüfen ist, ob folgende Einstellungen im BIOS getroffen wurden: Video BIOS Shadow: disabled System BIOS Shadow: disabled Assign IRQ for VGA: enabled Ein ganz anderes Problem können Laufwerke machen, wenn sie an zu langen IDE-Kablen hängen. Laut Spezifikation dürfen diese nur 47cm lang sein, was extrem kurz für große Tower ist. Meist funktioniert alles auch bei etwas längeren Kabeln, aber spätestens bei 80cm-Kabeln sollte man sehr skeptisch sein. Im Handel tauchen immer wieder spezielle runde IDE-Kabel, meist als "AirFlow"-Kabel bezeichnet, auf. Diese versprechen eine korrekte Funktion auch tlw. bei 90cm Kabellänge. Das wird erreicht, indem die 40 Leitungen, die seit UDMA66 zum IDE-Kabel hinzugekommen sind und nur Masseleitungen zur Dämpfung des Übersprechens zwischen den Signalleitungen darstellen, entweder um die einzlnen Signalleitungen gewickelt oder als Masse-Schirm als Netzgeflecht um die Signalleitungen gelegt werden. Damit erhält man die Signaleigenschaften, die denen von TwistedPair bzw. fast von Koaxialkabel entsprechen, sodass die größere Kabellänge möglich gemacht wird. Eine deutliche Verringerung der Gehäusetemperatur wird allerdings oft in der Praxis nicht festgestellt und eine Garantie für die korrekte Funktion kann auch nur der Hersteller versprechen. 10.3.3 Das Betriebssystem bootet mit Fehlern ============================================ Hier entsteht nun ein breites Feld an möglichen Fehlerquellen. Das beginnt mit reinen Hardwareproblemen, wie Überhitzung, defektem RAM, geht über Inkompatibilitäten zwischen Hardwarekomponenten bis hin zu Treiberproblemen. Sollte das Betriebssystem auch beim Minimalsystem nur mit Fehlern booten, so sind oft die üblichen 3 Verdächtigen zu suchen: Überhitzte CPU, defekter RAM und zu schwaches Netzteil. Hier sollte man seine CPU wie in 10.3.2 beschrieben untertakten und RAM bzw. Netzteil testweise austauschen. Seltener ist ein vorangegangener Totalcrash des Betriebssystems (was allerdings nichts mit der Hardware zu tun hat). Windows 9x / ME sind dafür bekannt, manchmal das Dateisystem der Festplatte nachhaltig zu zerstören. Scandisk / Scanreg sowie das manuelle Kopieren von möglicherweise defekten Dateien könnte helfen. 10.3.4 Das Betriebssystem konnte mit dem Minimalsystem gebootet werden ====================================================================== Für einen schnellen Test, um zwischen CPU und RAM als Fehlerquelle schon einmal eine Vorauswahl zu treffen, sollte man das System gezielt untertakten. Zwei Richtlinien (nur möglich und sinnvoll z.B. bei einer CPU mit 133MHz FSB und RAM, der ebenfalls bei 133MHz läuft und das Motherboard 100MHZ für FSB und RAM-Takt anbietet.): - Wenn möglich, den FSB herunter setzen, den RAM-Takt aber bei der Normaleinstellung belassen. Verschwinden die Abstürze, so ist der Fehler wohl eher bei der CPU (Hitze?) zu suchen. - Wenn möglich, den RAM-Takt herunter setzen, den FSB aber bei der Normaleinstellung belassen. Zusätzlich die RAM-Timings langsam stellen. Verschwinden die Abstütze, so ist der Fehler wohl eher beim RAM zu suchen. Hat man eine instabile CPU in Verdacht (Hitze oder Fertigungsfehler), so sollte man sie einem Streß-Test unterziehen. Das Programm Prime95 ist dafür recht gut geeignet. Spätestens nach 15 Minuten Test sollte klar ein, ob die CPU stabil ist. Wer ganz sicher gehen will, lässt so ein Programm eine Weile nebenher laufen, wenn er arbeitet. Dann ist allerdings nicht gewährleistet, dass ausschliesslich die CPU Probleme macht. Man kann so nur Abstürze provozieren und CPU und RAM in den engeren Kreis der Verdächtigen bringen. Den RAM kann man testen, wie in Kapitel 8.5.2 beschrieben. Sollte bis hierhin alles stabil sein und Abstürze z.B. nur in 3D-Spielen auftreten, kann man auch meist mit der Minimalkonfiguration die Spiele testen. Leider verlangen einige Spiele nach gewissen Dingen, wie einer Soundkarte. Hier sollte man ggf. auf andere Testspiele zurückgreifen. 10.3.5 Das Betriebssystem konnte normal gebootet werden ======================================================= Sinnvoll ist hier eine Abrüstung auf das Minimalsystem und schrittweise Aufrüstung - wie in 10.2.2 beschrieben. Danach sollte ein umfangreicher Test laufen, um den Fehler zu beobachten und zu provozieren. Des weitern sind neue Treiber für wirklich jede Komponente zu empfehlen. Manchmal ist der Störenfired eben eine Komponente, die eigntlich gar nichts mit dem offensichtlichen Problem zu tun haben scheint. Unter Windows ist ein aktuellen DirectX ebenso wichtig. 10.3.6 Checkliste ================= Die folgende Checkliste soll Ansatzpunkte geben, um Fehler weiter einzugrenzen und grobe Fehlkonfigurationen auszuschließen. Software: Die folgenden Hinweise gelten insbesondere für Windows-User. * Chipsatztreiber für das Motherboard installieren * aktuelle Treiber für alle Hardwarekomponenten, insbesondere für die Grafikkarte installieren * aktuelles DirectX verwenden * aktuelle BIOS-Versionen verwenden, insbesondere für das Motherboard Hardware: * Wenn der Rechner überhaupt nicht startet: AGP-Grafikkarten müssen tief und fest im Slot sitzen. Ruhig sinnvoll dosierte Gewalt anwenden. * Netzteil gemäß Spezifikation in 10.2.1 einsetzen. * Kontrollieren, ob der ATX-Power-Stecker fest auf dem Motherboard sitzt. Er darf im Betrieb nicht warm werden. * System nicht übertakten, RAM-Timings automatisch einstellen lassen oder manuell auf die langsamsten Timings einstellen. * Hitze im Rechner überprüfen, testweise das Gehäuse öffnen (auch RAM kann überhtitzen). * Funktion aller Lüfter überprüfen. * Korrekten Sitz des Kühlkörpers auf der CPU (wenig Wärmeleitpaste) sicherstellen. * IDE-Laufwerke an normgerechten IDE-Kabeln betreiben und einzelne Laufwerke am Ende des Kabel anstöpseln. * PC von Dreck säubern, dabei eventuell Steckkarten, RAM, CPU herausziehen und Laufwerke abziehen und die Slots / Stecker säubern. * CPU in den Sockel mit ganz leichtem Druck einsetzen, sodass sie tief in den Sockel rutscht. * Wenn mit dem Minimalsystem keine Probleme auftreten, dann PCI-Steckkarten in anderen PCI-Slots betreiben, um IRQ-Sharing zu vermeiden. * Motherboard und Netzteil (Vorsicht - gefährliche Spannung und Garantieverlust beim Öffnen!) untersuchen, ob Kondensatoren beschädigt sind (Kapitel 10.3.1.6). 10.3.7 Fazit ============ Da jetzt mehr und mehr Softwareprobleme die Ursache sein können, sollte FAQ an dieser Stelle nicht weiter ins Detail gehen. Es kann nur ein sinnvolles und überlegtes Vorgehen bei der Fehlersuche empfohlen werden. Der Fehler sollte genau beobachtet werden, um sinnvolle Rückschlüsse ziehen zu können. Auch wenn man dann durch Kombination von verschiedenen Beobachtungen nahezu einige Dinge ausschliessen kann, so sollte man sie nie ganz aus dem Gedächtnis entfernen. Manchmal hat schon eine defekte Maus einen Rechner ständig und nicht reproduzierbar zum Abstürzen gebracht.