Udostępnij przez


Strategie architektury optymalizacji kosztów danych

Dotyczy tego zalecenia listy kontrolnej dotyczącej optymalizacji kosztów platformy Azure Well-Architected Framework:

CO:10 Optymalizowanie kosztów danych. Wydatki na dane z priorytetem danych. Optymalizacja danych powinna obejmować ulepszenia zarządzania danymi (warstwy i przechowywanie), wolumin, replikację, kopie zapasowe, formaty plików i rozwiązania magazynu.

W tym przewodniku opisano zalecenia dotyczące optymalizowania kosztów danych dla obciążenia. Optymalizacja kosztów danych polega na zminimalizowaniu wydatków związanych z przechowywaniem i zarządzaniem danymi zgodnie z ich istotnością i częstotliwością dostępu. Odpowiednie zarządzanie danymi może znacznie obniżyć koszty związane z obciążeniem i dostosować wydatki do narzędzia danych. Zaniedbanie optymalizacji kosztów danych może prowadzić do zawyżonego wydatków, nieefektywnej alokacji zasobów i strat finansowych z powodu nieprawidłowo wyrównanych rozwiązań magazynu i niepotrzebnego przechowywania danych.

Definicje

Termin Definicja
Zarządzanie cyklem życia danych Proces zarządzania danymi w całym cyklu życia, od utworzenia do usunięcia. Ten proces obejmuje organizowanie, przechowywanie, ochronę i archiwizowanie danych na podstawie ich wartości i wzorców użycia.
Nadmiarowość danych Praktyka przechowywania zduplikowanych kopii danych w wielu systemach magazynowania lub lokalizacjach. Celem nadmiarowości danych jest zwiększenie dostępności danych i odporności na uszkodzenia.
Warstwowanie danych Strategia magazynowania obejmująca kategoryzowanie danych na podstawie częstotliwości dostępu i przechowywanie ich odpowiednio w warstwach magazynowania.
Zasady przechowywania Czas trwania przechowywania danych przed ich usunięciem. Określa okres, w którym dane muszą zostać zachowane, aby spełniały wymagania prawne, prawne lub biznesowe.

W ramach określonego obciążenia optymalizujesz koszty danych, zmniejszając koszty związane z przechowywaniem danych i zarządzaniem nimi. Istnieją różne strategie i najlepsze rozwiązania w celu zminimalizowania kosztów magazynowania i przetwarzania danych. Celem jest dostosowanie kosztów danych do priorytetu danych. Warstwy kosztów należy przypisać do typów danych na podstawie ich ważności lub częstotliwości dostępu.

Podstawowymi sterownikami kosztów danych obciążenia są częstotliwość dostępu, opóźnienie dostępu i ilość miejsca do magazynowania. Poniższe wskazówki zawierają strategie optymalizacji kosztów dla tych czynników kosztów.

Tworzenie spisu danych

Zanim będzie można zoptymalizować koszt danych, musisz wygenerować spis danych. Sprawdź dostęp do danych i określ jego znaczenie w obciążeniu i jego operacjach. Zidentyfikuj, do których danych często uzyskuje się dostęp, i do których danych uzyskuje się rzadziej. Następujące akcje spisu mogą pomóc w efektywnym przydzielaniu zasobów magazynu:

  • Zbieranie informacji o dostępie do danych: Przeprowadzanie inspekcji danych w celu zidentyfikowania i wykazu wszystkich magazynów danych. Określ wartość zestawów danych na podstawie ich znaczenia dla operacji biznesowych, zwrotu z inwestycji i częstotliwości użytkowania. Zbierz dzienniki dostępu, metryki użycia lub analizę z rozwiązań magazynu danych.

  • Identyfikowanie typów danych: Kategoryzuj dane na podstawie ich typu, takich jak dane osobowe, dane finansowe, własność intelektualna lub dane operacyjne. Poznaj wrażliwość i ważność każdego typu danych.

  • Identyfikowanie wzorców dostępu: Zidentyfikuj wzorce dostępu do danych, takie jak wzorce dziennego, tygodniowego lub miesięcznego użycia. Należy zrozumieć opóźnienia, rozmiary plików i wymagania dotyczące aktualności danych dla tych danych.

Określanie priorytetów danych

Priorytetyzacja danych to proces kategoryzowania i przypisywania poziomów ważności do typów danych na podstawie poufności i istotności. Priorytet danych powinien być zgodny z znaczeniem środowiska. Na przykład dane produkcyjne są ważniejsze niż dane przedprodukcyjne.

Oceń znaczenie różnych typów danych dla obciążenia, wykonując następujące kroki:

  1. Zdefiniuj poziomy priorytetów: Ustanów poziomy priorytetów dla danych (takich jak wysokie, średnie i niskie) na podstawie ich wartości dla organizacji, wymagań regulacyjnych i potencjalnego wpływu utraty danych. Celem jest dopasowanie priorytetu danych do odpowiedniego rozwiązania danych.

  2. Przypisz etykiety: Etykietuj każdy zestaw danych z jego poufnością i krytycznością. Etykiety można stosować na poziomie wiersza, kolumny lub pliku w zależności od struktury danych i użycia. W przypadku baz danych można użyć specjalnego narzędzia do etykietowania i powiązania poufności i krytycznych danych z określonymi wierszami i kolumnami. Takie podejście zapewnia szczegółową kontrolę nad zarządzaniem danymi i dostępem do danych.

Optymalizowanie zarządzania danymi

Zarządzanie danymi to proces przechowywania, przenoszenia i zabezpieczania danych obciążenia. Optymalizując zarządzanie danymi, można dostosować wydatki do priorytetu danych i uzyskać więcej wartości na podstawie danych. Rozważ następujące strategie zarządzania danymi.

Optymalizowanie zarządzania cyklem życia danych

Ważne jest, aby zarządzać danymi w całym cyklu życia. Etapy cyklu życia obejmują tworzenie danych (lub pozyskiwanie), magazyn, użycie, udostępnianie, przechowywanie i usuwanie (usuwanie lub archiwizowanie). Celem zarządzania cyklem życia danych jest zoptymalizowanie rozwiązań do magazynowania danych przy zachowaniu zgodności z odpowiednimi przepisami i zasadami.

Magazyn danych ma trzy krytyczne składniki kosztów:

  • Koszt magazynu: wydatki związane z przechowywaniem danych, takich jak za gigabajt.

  • Koszt transakcji: koszty związane z operacjami danych, takimi jak operacje zapisu, operacje odczytu i pobieranie danych (za gigabajt). Odczytywanie i zapisywanie danych może mieć różne koszty.

  • Koszt opóźnienia: koszt związany z szybkością lub opóźnieniem uzyskiwania dostępu do danych.

Poniżej przedstawiono podstawowe zagadnienia związane z zarządzaniem cyklem życia danych:

  • Użyj warstw danych: Celem obsługi warstw danych jest dostosowanie dostępu i przechowywania do najbardziej ekonomicznej warstwy magazynowania. Warstwy magazynowania wahają się od częstego/natychmiastowego dostępu (gorąca) do rzadko/opóźnionego dostępu (zimno).

    To kosztuje więcej, aby korzystać z warstwy, która nie jest zgodna z potrzebami dostępu do danych i przechowywania. Na przykład dane, do których aplikacja uzyskuje dostęp, często powinny znajdować się w magazynie gorącym. Dane, do których aplikacja uzyskuje dostęp rzadko, powinny znajdować się w magazynie zimnym. Efektywne zarządzanie tymi aspektami pomaga zapewnić wydajny magazyn danych.

  • Weź pod uwagę wymagania dotyczące zgodności: Implementowanie warstw danych wymaga starannego rozważenia wymagań dotyczących zgodności i zasad ładu danych. Zgodność i wymagania prawne często napędzają dostęp do danych i ich przechowywanie. Ustanów zasady przechowywania danych, aby zapewnić zgodność z wymaganiami prawnymi, prawnymi i biznesowymi.

  • Definiowanie zasad cyklu życia danych. Zasady cyklu życia danych określają, kiedy i jak dane mają być przenoszone między warstwami magazynowania na podstawie wstępnie zdefiniowanych kryteriów. Te zasady zapewniają przechowywanie danych w odpowiedniej warstwie przez wymagany czas trwania. Na przykład zasady mogą określać, że dane muszą być przechowywane w warstwie Gorąca przez 30 dni, w warstwie Chłodna przez 90 dni i w warstwie Archiwum przez jeden rok. Ustaw okres przechowywania na podstawie czynników, takich jak wymagania prawne, przepisy branżowe lub zasady wewnętrzne.

  • Automatyzacja: zasady przechowywania mogą wyzwalać przenoszenie danych między warstwami. Przed utworzeniem dowolnego rozwiązania niestandardowego należy zautomatyzować zasady przy użyciu funkcji platformy.

    Po wygaśnięciu okresu przechowywania dla określonej warstwy zasady mogą automatycznie przenosić dane do następnej niższej warstwy kosztów. Na przykład po zakończeniu okresu przechowywania dla warstwy Gorąca zasady mogą przenosić dane do warstwy Chłodna. Zasady zapewniają ciągłą optymalizację danych na podstawie wzorców dostępu i wymagań dotyczących kosztów.

Kompromis: Zarządzanie zasadami przechowywania danych wymaga ciągłego monitorowania i konserwacji. Może ona wprowadzać większe obciążenie na potrzeby procesów zarządzania danymi. Może to również mieć wpływ na koszty magazynowania. Dłuższe okresy przechowywania lub użycie warstw magazynowania o wyższych kosztach może zwiększyć wydatki na magazyn.

Ryzyko: Słaba implementacja zarządzania cyklem życia danych może prowadzić do utraty danych lub ograniczonego dostępu do danych krytycznych. Należy mieć odpowiednie mechanizmy tworzenia kopii zapasowych i odzyskiwania, aby ograniczyć ryzyko utraty danych.

Optymalizowanie segmentacji danych

Optymalizacja segmentacji danych obejmuje strategiczne organizowanie danych w różnych segmentach i konsolidację podobnych typów danych w celu efektywnego przydzielania zasobów magazynu. Umożliwia dostosowanie alokacji zasobów magazynu do priorytetu danych.

Aby skutecznie zoptymalizować segmentację danych, należy kategoryzować dane według typu i wzorca użycia. Następnie umieszczasz segmenty danych na najbardziej efektywnym rozwiązaniu w zależności od ich podobieństw operacyjnych i wymagań. Na przykład umieszczasz dane, które wymagają magazynu o wysokiej wydajności na zasobach z krótszym czasem pobierania. Dane archiwalne używają tańszego zasobu z wolniejszym czasem pobierania.

Takie podejście gwarantuje, że dane o wysokim zapotrzebowaniu korzystają z szybszego magazynu w celu uzyskania optymalnej wydajności i mniejszego dostępu do danych korzystają z tańszego magazynu. Podobnie, gdy typy danych współużytkują wzorce użycia, należy je zgrupować w jednym zasobie, aby zmniejszyć obciążenie, uprościć zarządzanie i poprawić obsługę danych.

Minimalizuj transfer danych

Minimalizacja transferu danych odnosi się do zmniejszenia przenoszenia danych między sieciami w celu zmniejszenia kosztów transferu danych. Zmniejsza to ilość danych, które obciążenie przenosi i obniża opłaty za użycie sieci. Aby zminimalizować transfer danych, należy wziąć pod uwagę następujące zalecenia:

  • Użyj odpowiedniej lokalizacji. umieść dane geograficznie bliżej swoich użytkowników. Bliskość danych zmniejsza podróże sieciowe, co przyspiesza dostęp i optymalizuje koszty.
  • Użyj buforowania. Rozważ zalety buforowania, aby zminimalizować transfer danych.
  • Użyj sieci dostarczania zawartości. Sieć dostarczania zawartości może przechowywać często odczytywane dane statyczne bliżej użytkowników. Zmniejsza ona przenoszenie danych przez sieć i ułatwia odciążanie użycia przepustowości.

Optymalizowanie zabezpieczeń i zgodności

Niektóre dane produkcyjne wymagają wyższych wymagań dotyczących zabezpieczeń i zgodności. Te środki mogą nakładać dodatkowe koszty związane z ochroną danych, szyfrowaniem, tworzeniem kopii zapasowych, przechowywaniem i inspekcją.

Należy upewnić się, że zmiany w rozwiązaniach magazynu danych są zgodne z tymi wymaganiami. Dane, które mają niższe wymagania dotyczące zabezpieczeń i zgodności, często stanowią okazję do optymalizacji kosztów.

Optymalizowanie woluminu danych

Znajdowanie strategii zmniejszania ilości przechowywanych danych może pomóc zmniejszyć koszty. Zmieniając dostępność danych i wdrażając następujące techniki, można skutecznie zoptymalizować ilość przechowywanych danych:

  • Przechwyć mniej danych: przyjrzyj się bliżej przechwyceniom danych. Ustal, czy którykolwiek z tych elementów jest niepotrzebny do Twoich celów. Zmodyfikuj proces, ustawienia lub konfiguracje, aby przechwycić tylko niezbędne dane.

  • Kompresuj dane: kompresja oszczędza pieniądze, zmniejszając rozmiar danych. Jest to najbardziej skuteczne w scenariuszach z operacjami zapisu jednokrotnego, nigdy nie do odczytu lub odczytu. Bardziej nadaje się do chłodniejszego przechowywania.

    Kompromis: Zarówno kompresja, jak i dekompresja danych zwiększają czas procesora CPU.

  • Usuwanie niepotrzebnych danych: zaimplementuj zasady, aby usprawnić proces przechowywania odpowiednich informacji. Oceń okres przechowywania kopii zapasowych i migawek oraz usuń dane, których już nie potrzebujesz. Może być konieczne posiadanie procesu prowadzącego do ewentualnego usunięcia danych, takiego jak pierwsze archiwizowanie danych i włączenie okresu usuwania nietrwałego. Przed usunięciem danych należy zawsze rozważyć możliwość odzyskiwania.

  • Deduplikacja danych: zaimplementuj techniki deduplikacji danych w celu wyeliminowania nadmiarowych danych. Deduplikacja zmniejsza wymagania dotyczące magazynu, zapewniając przechowywanie tylko unikatowych bloków danych, dzięki czemu można zaoszczędzić koszty. Użyj algorytmów tworzenia skrótów i porównania fragmentów danych. Regularnie uruchamiaj procesy deduplikacji, aby zidentyfikować i wyeliminować zduplikowane dane.

  • Optymalizowanie zachowania użytkownika: w obciążeniach zbierających dane generowane przez użytkownika należy edukować użytkowników o znaczeniu wydajnego przechowywania danych. Zachęcaj ich do regularnego przeglądania i usuwania niepotrzebnych plików i danych. Zaimplementuj limity przydziału magazynu lub modele cenowe, które zniechęcają do nadmiernego przechowywania danych.

Optymalizowanie replikacji danych

Replikacja danych obejmuje tworzenie wielu kopii danych i przechowywanie ich w innych lokalizacjach geograficznych lub strefach w celu uzyskania niezawodności. Replikacja gwarantuje, że jeśli jedna lokalizacja lub strefa wystąpi awaria lub awaria, nadal można uzyskać dostęp do danych z replikowanych kopii w innych lokalizacjach.

Ta nadmiarowość pomaga zwiększyć dostępność i odporność danych. Minimalizuje ryzyko utraty i przestoju danych.

Aby zoptymalizować replikację danych pod kątem optymalizacji kosztów, należy wziąć pod uwagę następujące wskazówki:

  • Ocena wymagań dotyczących replikacji danych: oceń określone potrzeby obciążenia i określ wymagany poziom replikacji danych. Rozważ czynniki, takie jak krytyczne znaczenie danych, cele czasu odzyskiwania (RTO) i cele punktu odzyskiwania (RPO).

  • Wybierz odpowiednią strategię replikacji: wybierz technologię replikacji, która jest zgodna z celami optymalizacji kosztów. Weź pod uwagę wymagania umowy dotyczącej poziomu usług (SLA) dla obciążenia.

    Oceń opcje, takie jak replikacja synchroniczna, replikacja asynchroniczna lub kombinacja obu tych opcji. Na podstawie decyzji o czynnikach, takich jak wymagania dotyczące spójności danych i zagadnienia dotyczące przepustowości sieci. Oceń poziom dostępności potrzebnej dla obciążenia i oceń potrzebę nadmiarowości strefowej i regionalnej.

  • Optymalizowanie przepustowości sieci: zminimalizuj użycie przepustowości sieci, implementując techniki kompresji i deduplikacji danych. Te techniki mogą zmniejszyć ilość danych przesyłanych podczas replikacji, co może obniżyć koszty.

  • Monitorowanie i optymalizowanie częstotliwości replikacji: regularnie sprawdzaj i dostosowuje częstotliwość replikacji na podstawie zmieniających się potrzeb obciążenia. Dostrajanie częstotliwości replikacji może pomóc w optymalizacji kosztów dzięki zmniejszeniu niepotrzebnych obciążeń związanych z replikacją.

Optymalizowanie kopii zapasowych

Kopia zapasowa to okresowa migawka lub kopia danych, które można tworzyć i przechowywać oddzielnie od magazynu podstawowego. Jeśli wystąpi uszkodzenie danych, przypadkowe usunięcie lub awaria systemu, możesz użyć kopii zapasowych, aby przywrócić dane do poprzedniego stanu.

Poniżej przedstawiono kilka technik optymalizacji kopii zapasowych:

  • Klasyfikacja danych: klasyfikuj dane na podstawie jego ważności i priorytetyzacji kopii zapasowej. Klasyfikacja pomaga skoncentrować zasoby na kopii zapasowej danych krytycznych, jednocześnie minimalizując koszty tworzenia kopii zapasowych dla danych, które są mniej ważne.

  • Przyrostowe kopie zapasowe: Zamiast wykonywać pełne kopie zapasowe za każdym razem, rozważ zaimplementowanie przyrostowych kopii zapasowych. Przyrostowe kopie zapasowe przechwytują tylko zmiany wprowadzone od ostatniej kopii zapasowej, co może zmniejszyć wymagania dotyczące magazynu i przepustowości sieci.

    Kompromis: przyrostowe kopie zapasowe wymagają więcej kroków i czasu na przywrócenie danych. Należy najpierw przywrócić pełną kopię zapasową, a następnie zastosować każdą przyrostowy kopię zapasową w sekwencji do momentu osiągnięcia żądanego punktu przywracania.

  • Kompresja kopii zapasowej: włącz kompresję podczas procesu tworzenia kopii zapasowej, aby zmniejszyć rozmiar plików kopii zapasowej. Skompresowane kopie zapasowe wymagają mniejszej ilości miejsca do magazynowania, dzięki czemu można zaoszczędzić koszty.

  • Warstwy magazynowania kopii zapasowych: oceń zasady przechowywania kopii zapasowych i rozważ przeniesienie starszych kopii zapasowych do warstw magazynowania niższego kosztu, takich jak zimny magazyn lub magazyn archiwum. Przechowywanie rzadziej używanych kopii zapasowych w oszczędnych opcjach magazynu pomaga zoptymalizować koszty.

  • Okres przechowywania kopii zapasowych: przejrzyj i dostosuj okresy przechowywania kopii zapasowych na podstawie wymagań biznesowych i przepisów dotyczących zgodności. Utrzymywanie kopii zapasowych przez dłuższy czas może prowadzić do dodatkowych kosztów magazynowania.

  • Częstotliwość tworzenia kopii zapasowych: analizowanie częstotliwości tworzenia kopii zapasowych dla różnych typów danych. Dostosuj harmonogram tworzenia kopii zapasowych na podstawie częstotliwości zmian danych i znaczenia danych. Te rozwiązania pomagają wyeliminować niepotrzebne kopie zapasowe i zmniejszyć koszty magazynowania.

Optymalizowanie formatów plików

Formaty plików wpływają na optymalizację kosztów, optymalizując wzorce we/wy danych wejściowych i wyjściowych oraz wzorce zapytań dotyczących danych. Niektóre formaty plików zaspokajają konkretne scenariusze. Dostosowanie formatu pliku do wymagań dotyczących obciążenia może poprawić wydajność obciążenia.

Poniżej przedstawiono zagadnienia dotyczące typowych formatów:

  • Avro: Format pliku Avro jest dobrym wyborem, gdy masz do czynienia z wzorcami we/wy z dużą ilością zapisu lub gdy wzorce zapytań wymagają pobrania wielu wierszy rekordów w całości. Procesy serializacji i deserializacji avro są wydajne, więc jest zgodne z magistralami komunikatów, takimi jak Kafka, które tworzą serię zdarzeń i komunikatów w krótkim odstępie czasu.

  • Parquet i Optimized Row Columnar (ORC): Formaty plików Parquet i ORC są excel w scenariuszach wzorców we/wy z dużą liczbą operacji odczytu lub gdy wzorce zapytań koncentrują się na określonych kolumnach rekordów.

    Oba formaty to magazyn kolumnowy, co oznacza, że dane są przechowywane według kolumny, a nie wiersz po wierszu. Magazyn kolumnowy umożliwia ulepszoną kompresję i wydajne operacje odczytu. Należy pobrać tylko wymagane kolumny, aby uniknąć niepotrzebnych operacji we/wy dla nieistotnych danych.

Optymalizowanie rozwiązań magazynu

Oceń i wybierz najbardziej odpowiednie metody magazynowania i systemy dla Twoich danych. Może to obejmować przełączanie baz danych, używanie różnych typów magazynu lub dodawanie mechanizmów buforowania. Łatwość zarządzania to kolejny czynnik, który należy wziąć pod uwagę podczas wybierania rozwiązania magazynu.

Dzięki dostosowaniu rozwiązań magazynu do konkretnych potrzeb i cech danych można osiągnąć lepszą efektywność kosztową, spełniając wymagania dotyczące wydajności i skalowalności. Istnieją koszty związane z przełączaniem baz danych lub zamianą usług, ale przechowywanie danych w niewłaściwym rozwiązaniu magazynu może kosztować dodatkowe pieniądze.

Oto kilka przypadków użycia:

  • Przełączanie baz danych: możesz rozważyć przełączenie do systemu bazy danych, który lepiej odpowiada Twoim potrzebom. Jeśli na przykład używasz relacyjnej bazy danych, możesz zapoznać się z opcją przejścia do bazy danych NoSQL, jeśli dane są bardziej zorientowane na dokument lub wymagają elastycznych schematów.

  • Przenoszenie z relacyjnej bazy danych do magazynu plików prostych: w niektórych przypadkach przechowywanie danych w plikach prostych zamiast tradycyjnej relacyjnej bazy danych może zapewnić zalety, takie jak prostota i opłacalność. Proste pliki są odpowiednie dla niektórych typów danych, takich jak pliki dziennika lub dane, które nie wymagają złożonych zapytań. Można na przykład przechowywać obrazy binarne w bazie danych SQL, ale bardziej ekonomiczne przechowywanie ich w usłudze magazynu przeznaczonej specjalnie do obsługi danych binarnych.

  • Optymalizowanie kosztów danych dzienników za pomocą podsumowania: w przypadku strumieni danych dziennika o dużej ilości rozważ użycie technik podsumowania w celu zmniejszenia kosztów magazynowania przy zachowaniu możliwości analitycznych.

  • Przejście z infrastruktury jako usługi (IaaS) do platformy jako usługi (PaaS): rozwiązania bazy danych IaaS mogą być czasochłonne i intensywnie obciążające zasoby właściwości, które odwracają uwagę zespołu technicznego od podstawowych zadań. Wzrost ilości danych i wyzwania związane z ręcznym skalowaniem, tworzeniem kopii zapasowych i konserwacją infrastruktury może sprawić, że rozwiązanie PaaS będzie bardziej ekonomiczne i wydajne.

  • Dodawanie pamięci podręcznej: aby zmniejszyć użycie zasobów na głównym serwerze bazy danych, rozważ użycie rozwiązania pamięci podręcznej do buforowania złożonych wyników zapytań. Rightsizing the database server może pomóc w optymalizacji kosztów. W odpowiednich przypadkach użycia rozważ użycie czasu wygaśnięcia (TTL) z buforowanych danych, aby zmniejszyć potrzeby magazynu i zmniejszyć koszty.

  • Magazyny magazynu danych zoptymalizowane pod kątem zapytań i magazynu danych: magazyny zoptymalizowane pod kątem zapytań są przeznaczone do szybkiego pobierania i analizowania danych. Koncentrują się na szybkim pozyskiwaniu i odczytywaniu danych, ale nie są to częste aktualizacje. Doskonale nadają się do danych szeregów czasowych i szybkiego dostępu do najnowszych danych, ale nie w przypadku dużych zadań transakcyjnych.

    Magazyny danych obsługują duże ilości elastycznych danych, zwłaszcza danych nieustrukturyzowanych lub częściowo strukturalnych. Chociaż magazyny magazynu danych mogą obsługiwać analizę, złożone zadania mogą wymagać wyspecjalizowanych baz danych. Najlepiej jest przechowywać wiele danych zmiennych, takich jak dzienniki lub zawartość wygenerowana przez użytkownika w scenariuszach, takich jak przypadki użycia noSQL.

Ułatwienia platformy Azure

Tworzenie spisu danych: Microsoft Purview to rodzina rozwiązań do zapewniania ładu, ryzyka i zgodności danych, które mogą pomóc organizacji w zarządzaniu całym zasobami danych i zarządzaniu nimi. Rozwiązania Microsoft Purview zapewniają zintegrowane pokrycie i pomagają w rozwiązywaniu ostatnich wzrostów łączności użytkowników zdalnych, fragmentacji danych w organizacjach oraz rozmycia tradycyjnych ról zarządzania IT.

Optymalizacja zarządzania danymi: usługi Azure Storage i Azure Data Lake Storage mają różne warstwy dostępu do danych. Oferują one również zasady zarządzania cyklem życia danych , które automatyzują obsługę warstw danych i ich przechowywanie.

Możesz użyć zasad opartych na regułach, aby przenieść dane obiektów blob do odpowiednich warstw dostępu lub wygasnąć dane po zakończeniu jego cyklu życia. Te zasady umożliwiają natychmiastowe przejście obiektów blob z chłodnych (lub zimnych) na gorące, gdy są one dostępne, w celu zoptymalizowania pod kątem wydajności.

Optymalizowanie kopii zapasowych: usługa Azure Backup oferuje wiele możliwości usprawniania tworzenia kopii zapasowych. Oferuje ona funkcje, takie jak natywna kopia zapasowa bazy danych i kopia zapasowa magazynu za pośrednictwem migawek dysków. Obsługuje tworzenie kopii zapasowych maszyn wirtualnych, długoterminowe przechowywanie i zarządzanie kopiami zapasowymi.

Oto niektóre funkcje usługi:

  • Monitorowanie: Centrum kopii zapasowych można używać jako pojedynczego okienka szkła do monitorowania zadań i spisu kopii zapasowych na bieżąco. Centrum kopii zapasowych udostępnia interfejs raportów kopii zapasowych, które używają dzienników usługi Azure Monitor i skoroszytów platformy Azure.

  • Raporty: Raporty kopii zapasowych oferują następujące możliwości:

    • Przydzielanie i prognozowanie zużytego magazynu w chmurze.
    • Przeprowadź inspekcję kopii zapasowych i przywracania.
    • Identyfikowanie kluczowych trendów na różnych poziomach szczegółowości.
    • Uzyskaj wgląd i wgląd w możliwości optymalizacji kosztów dla kopii zapasowych.
  • Pojemność zarezerwowana: Pojemność zarezerwowana usługi Azure Backup Storage oferuje rabat na pojemność dla danych kopii zapasowych przechowywanych w warstwie Standardowa magazynu podczas zatwierdzania rezerwacji przez jeden rok lub trzy lata. Rezerwacja zapewnia stałą ilość pojemności magazynu kopii zapasowych dla okresu rezerwacji.

  • Warstwa Archiwum: możesz użyć usługi Azure Backup do przechowywania danych kopii zapasowych, w tym danych kopii zapasowych długoterminowego przechowywania (LTR), zgodnie z potrzebami przechowywania zdefiniowanymi przez reguły zgodności organizacji. W większości przypadków starsze dane kopii zapasowej są rzadko dostępne i są przechowywane tylko w celu zapewnienia zgodności. Usługa Azure Backup obsługuje tworzenie kopii zapasowych punktów LTR w warstwie archiwum, a także migawki i warstwę Standardowa.

Optymalizowanie rozwiązań magazynu: platforma Azure ma wiele rozwiązań magazynu. Oferują one różne funkcje i możliwości, które ułatwiają optymalizowanie kosztów na podstawie określonych wymagań. Platforma Azure ma wskazówki ułatwiające wybór odpowiedniego magazynu danych.

Aby wybrać najbardziej odpowiednie rozwiązanie magazynu i konfigurację, ważne jest, aby ocenić wzorce dostępu do danych, potrzeby związane z przechowywaniem i wymagania dotyczące wydajności. Regularne monitorowanie i optymalizowanie użycia magazynu przy użyciu narzędzi, takich jak Usługa Azure Advisor, może pomóc w dalszej optymalizacji kosztów.

Optymalizowanie zapytańreguł podsumowania usługi Azure Monitor Log Analytics umożliwia automatyczne podsumowywanie strumieni danych o wysokiej szybkości pozyskiwania w różnych warstwach usług. Takie podejście zapewnia ekonomiczne długoterminowe przechowywanie danych, tworząc architektury warstwowe, w których szczegółowe dane pierwotne są agregowane w podsumowanych zestawach danych na potrzeby analizy i raportowania, co znacznie zmniejsza koszty magazynowania przy jednoczesnym zachowaniu szczegółowych informacji analitycznych.

Lista kontrolna optymalizacji kosztów

Zapoznaj się z pełnym zestawem zaleceń.