Komunikat błędu kości pamięci raportowany w logach systemowych nie jest jednoznacznym wskaźnikiem jej uszkodzenia

Błąd pamięci może zostać spowodowany między innymi uszkodzeniem slotu pamięci, procesora, Microcodebug, zanieczyszczenia slotu. Szczegółowa diagnostyka umożliwia dokładne stwierdzenie przyczyny uszkodzenia i szybsze usunięcie usterki.

Diagnostyka:

1. Zaktualizować BIOS Serwera à BIOS G12

2. Wyczyścić Eventlog à Instrukcja

3. Wyłączyć C1e oraz CStates w ustawieniach BIOS
   zmienić ustawienie PowerManagement na Maximum Performance
à  
  
*Instrukcja dostępna na końcu artykułu

4. Sprawdzić Memory Operating Mode w BIOSie pod System Bios Settings / 
   Memory
Settings. Celem testów proszę ustawić opcję na Optimizer Mode.

5. Wyłączyć serwer, odłączyć od źródła zasilania. Przytrzymać przycisk Power
    przez
około 10 sekund.

    !Uwaga! Jeśli to możliwe, proszę użyć maty elektrostatycznej (ESD).

6. Otworzyć pokrywę serwera i zlokalizować raportowany w logach moduł
    DIMM 
(schemat rozmieszczenia modułów pamięci znajduje się na
    wewnętrznej stronie 
pokrywy).

7. Wykonać test krzyżowy pamięci:

  • Serwer z jednym procesorem:

    Przemieścić raportowaną kość pamięci z identycznym modułem w innym kanale (np. A1 z A2)
  • Serwer z więcej niż jednym procesorem

    Przemieścić raportowana kość pamięci z identycznym modułem pod innym  procesorem (np. A4 z B4)

8. Włączyć serwer i sprawdzić w Eventlog, czy pojawiły się nowe komunikaty
    błędów.


Analiza komunikatów w Eventlog:

Opcja 1: Brak nowych wpisów w logu może oznaczać, że problem został rozwiązany poprzez zresetowanie modułów (np. problem z łącznością slot-DIMM). Dodatkowo można wykonać test pamięci MpMemory à Test

Opcja 2: Komunikat błędu w Eventlog „podąża” za przemieszczoną kością pamięci (zidentyfikowaną, jako potencjalnie uszkodzoną). Prawdopodobnie moduł DIMM uległ uszkodzeniu i wymaga wymiany. Prosimy skontaktować się ze Wsparciem Technicznym DELL z wynikami testów.

Opcja 3: Jeżeli komunikat błędu wskazuje na ten sam slot jak sprzed testu krzyżowego, można wykonać dodatkowo test krzyżowy procesora. Prosimy skontaktować się ze Wsparciem Technicznym DELL z wynikami testów.

Test krzyżowy procesora powinien zostać wykonany przez wykwalifikowany personel techniczny.

Opcja 4: Błąd pamięci nie ustąpił, a przyczyna uszkodzenia nie jest jednoznacznaà prosimy o wygenerowanie raportu DSET i kontakt ze Wsparciem Technicznym.



*Ustawienia C1e, C States oraz PowerManagement:

1. Wejść w tryb konfiguracji BIOS przez wciśnięcie klawisza <F2>

2. W głównym menu przejść do System Bios Settings > System Profile
    Settings.

3. Zmienić ustawienia parametrów C1e i C States jako <Disabled> (jeśli
    <Enabled>)

4. Wybrać ustawienie Maximum Performance dla parametru Memory
    Frequency (o ile dotyczy).

 

 


W artkule zawarto wskazówki w zakresie rozwiązywania problemów technicznych. Artykuły zamieszczone na naszych stronach zostały opracowane i zweryfikowane przez specjalistów technicznych. Ze względu na ilość artykułów, nie każdy może zostać sprawdzony niezwłocznie po jego publikacji. Będziemy Państwu wdzięczni za komentarze i poprawki dotyczące artykułów. Uwagi prosimy kierować na adres: DE_LEJ_GSD_DTCG(at)Dell.com