Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Weryfikacja sprzętu (HWV) ocenia stan i kondycję składników sprzętowych maszyny bez systemu operacyjnego (BMM), wykonując przypadki testowe względem kontrolera zarządzania płytą główną (BMC). Obecnie platforma Azure Operator Nexus jest wdrażana na serwerach firmy Dell. Serwery firmy Dell korzystają ze zintegrowanego kontrolera dostępu zdalnego firmy Dell (iDRAC), który jest odpowiednikiem kontrolera BMC.
Omówienie narzędzi
Usługa HWV używa interfejsów API Redfish do komunikowania się z kontrolerem BMC programu BMM. Aktualizacje oprogramowania układowego HWV są wykonywane przy użyciu metody przesyłania oprogramowania układowego Redfish.
Kategorie weryfikacji sprzętu
Wyniki HWV można wyświetlić w obszarze roboczym klastra Log Analytics (LAW). Są one pogrupowane na pięć odrębnych kategorii.
- Informacje o systemie: szczegółowe informacje o sprzęcie serwera, takie jak model, numer seryjny, procesor CPU, licencja, oprogramowanie układowe i konfiguracja pamięci.
- Informacje o dysku: Stan i spis urządzeń magazynujących, w tym typ, pojemność i kondycja każdego dysku.
- Informacje o sieci: informacje o interfejsach sieciowych, adresach MAC, stanie łącza, informacjach o sąsiadach i konfiguracji.
- Informacje o kondycji: ogólny stan kondycji składników sprzętowych, w tym czujników, zasilaczy i wentylatorów. Dzienniki krytyczne/błędy BMC i wyniki działań zakłócających są również wyświetlane w informacjach o stanie systemu.
- Informacje o rozruchu: Bieżąca kolejność rozruchu, konfiguracja urządzenia rozruchowego i powiązane ustawienia systemu BIOS.
Aktualizacje weryfikacji sprzętu i działania powodujące zakłócenia
Jeśli podczas HWV zostaną wykryte jakiekolwiek rozbieżności, narzędzia próbują przywrócić BMM do zdrowego/akceptowalnego stanu wdrożenia.
Działania powodujące zakłócenia w stosunku do programu BMM są uruchamiane zgodnie z potrzebami podczas działania HWV:
- Resetowanie kontrolera BMC/iDRAC
- Wirtualne usuwanie pcheł
- Uruchamianie i wyłączanie serwera
- Oczyszczanie certyfikatu TLS
- Resetowanie RAID
Akcje aktualizacji/automatycznego naprawiania:
- Automatyczna poprawka konfiguracji rozruchu systemu BIOS
- Automatyczne naprawianie składnika oprogramowania układowego
Jeśli działania powodujące zakłócenia lub aktualizację nie powiedzie się, wymagana jest interwencja użytkownika.
Aktualizacja składników oprogramowania układowego
HWV sprawdza, czy oprogramowanie układowe na serwerach Dell 15G (Ice Lake) i 16G (Sapphire Rapids) spełnia minimalną zalecaną wersję (N-2). Jeśli jakiekolwiek oprogramowanie układowe jest poniżej tego minimum, funkcja HWV automatycznie aktualizuje go do obsługiwanej, stabilnej wersji. W przypadku serwerów 15G HWV sprawdza i aktualizuje komponenty BIOS, iDRAC, NIC i CPLD. W przypadku serwerów 16G sprawdza i aktualizuje karty sieciowe i IDRAC. Jeśli funkcja HWV nie może automatycznie zaktualizować składnika, interwencja ręczna jest wymagana do uruchomienia oprogramowania układowego do minimalnej zalecanej wersji.
Wersje składników oprogramowania układowego i pomyślne/nieudane próby aktualizacji są rejestrowane w wynikach informacji o systemie.
Aktualne specyfikacje oprogramowania układowego Operator Nexus platformy Azure oraz wersje N-1 i N-2 można znaleźć tutaj: Wymagania wstępne dotyczące platformy Operator Nexus
Aktualizacja konfiguracji rozruchu systemu BIOS
HWV sprawdza, czy konfiguracja rozruchu systemu BIOS spełnia wymagania dotyczące pomyślnego uruchamiania. Jeśli jakiekolwiek ustawienia są nieprawidłowe, funkcja HWV automatycznie aktualizuje je w celu dopasowania ich do wymaganych specyfikacji.