Freigeben über


Architekturstrategien zur Optimierung von Datenkosten

Gilt für diese Azure Well-Architected Framework Cost Optimization Checkliste Empfehlung:

CO:10 Optimieren Sie die Datenkosten. Datenausgaben mit Datenpriorität. Die Datenoptimierung sollte Verbesserungen der Datenverwaltung (Tiering und Aufbewahrung), Volume, Replikation, Sicherungen, Dateiformate und Speicherlösungen umfassen.

In diesem Leitfaden werden die Empfehlungen zum Optimieren der Datenkosten für eine Workload beschrieben. Die Optimierung der Datenkosten beinhaltet die Minimierung der Kosten für die Speicherung und Verwaltung von Daten entsprechend ihrer Bedeutung und Zugriffshäufigkeit. Die geeignete Datenverwaltung kann die Kosten für den Aufwand erheblich reduzieren und die Ausgaben an das Datenhilfsprogramm anpassen. Die Vernachlässigung der Datenkosten kann aufgrund falsch ausgerichteter Speicherlösungen und unnötiger Datenaufbewahrung zu aufgeblasenen Ausgaben, ineffizienter Ressourcenzuordnung und finanzieller Abfälle führen.

Definitionen

Begriff Definition
Datenlebenszyklusverwaltung Der Prozess der Verwaltung von Daten während des gesamten Lebenszyklus, von der Erstellung bis zum Löschen. Dieser Prozess umfasst das Organisieren, Speichern, Schützen und Archivieren von Daten basierend auf ihren Wert- und Verwendungsmustern.
Datenredundanz Die Vorgehensweise zum Speichern doppelter Kopien von Daten über mehrere Speichersysteme oder Speicherorte hinweg. Zweck der Datenredundanz ist es, die Datenverfügbarkeit und Fehlertoleranz zu verbessern.
Datentiering Eine Speicherstrategie, die daten basierend auf ihrer Zugriffshäufigkeit kategorisiert und entsprechend auf Speicherebenen speichert.
Aufbewahrungsrichtlinie Die Dauer, für die Daten aufbewahrt werden sollen, bevor sie gelöscht werden können. Er gibt den Zeitraum an, in dem Daten aufbewahrt werden müssen, um gesetzliche, behördliche oder geschäftliche Anforderungen zu erfüllen.

Innerhalb einer bestimmten Arbeitsauslastung optimieren Sie die Datenkosten, indem Sie die Kosten für das Speichern und Verwalten von Daten reduzieren. Es gibt verschiedene Strategien und bewährte Methoden zur Minimierung von Datenspeicherungs- und Verarbeitungskosten. Ziel ist es, Die Datenkosten an die Datenpriorität auszurichten. Sie müssen Kostenstufen Typen von Daten basierend auf deren Wichtigkeit oder Häufigkeit des Zugriffs zuweisen.

Die primären Treiber für die Kosten von Workloaddaten sind Zugriffshäufigkeit, Zugriffslatenz und Speicherbetrag. Die folgende Anleitung enthält Strategien zur Optimierung der Kosten für diese Kostentreiber.

Erfassen eines Datenbestands

Bevor Sie die Kosten Ihrer Daten optimieren können, müssen Sie einen Bestand an Daten generieren. Überprüfen Sie den Datenzugriff, und bestimmen Sie ihre Wichtigkeit innerhalb Ihrer Arbeitsauslastung und ihrer Vorgänge. Ermitteln Sie, auf welche Daten häufig zugegriffen wird und auf welche Daten weniger häufig zugegriffen wird. Mit den folgenden Bestandsaktionen können Sie Speicherressourcen effektiv zuordnen:

  • Sammeln von Datenzugriffsinformationen: Führen Sie eine Datenüberwachung durch, um alle Datenspeicher zu identifizieren und zu katalogisieren. Ermitteln Sie den Wert von Datensätzen basierend auf ihrer Bedeutung für Geschäftsvorgänge, die Rendite für Investitionen und die Häufigkeit der Verwendung. Sammeln Sie Zugriffsprotokolle, Nutzungsmetriken oder Analysen aus Ihren Datenspeicherlösungen.

  • Identifizieren von Datentypen: Kategorisieren Sie Daten basierend auf ihrem Typ, z. B. personenbezogene Daten, Finanzdaten, geistiges Eigentum oder operative Daten. Verstehen der Vertraulichkeit und Kritischität jedes Datentyps.

  • Identifizieren von Zugriffsmustern: Identifizieren Sie die Muster im Datenzugriff, z. B. tägliche, wöchentliche oder monatliche Nutzungsmuster. Sie sollten die Anforderungen für Latenz, Dateigrößen und Datenfrischung für diese Daten verstehen.

Priorisieren von Daten

Bei der Datenpriorisierung handelt es sich um den Prozess der Kategorisierung und Zuweisung von Wichtigkeitsstufen zu Datentypen basierend auf Vertraulichkeit und Kritischität. Die Datenpriorität sollte mit der Bedeutung der Umgebung übereinstimmen. Produktionsdaten sind beispielsweise wichtiger als Vorproduktionsdaten.

Bewerten Sie die Wichtigkeit verschiedener Datentypen für Ihre Workload mithilfe der folgenden Schritte:

  1. Definieren von Prioritätsebenen: Legen Sie Prioritätsstufen für Daten (z. B. hoch, mittel und niedrig) basierend auf ihrem Wert für die Organisation, behördliche Anforderungen und potenzielle Auswirkungen von Datenverlusten fest. Ziel ist es, die Datenpriorität an der entsprechenden Datenlösung auszurichten.

  2. Bezeichnungen zuweisen: Bezeichnen Sie jeden Datensatz mit vertraulichkeit und kritischer Bedeutung. Je nach Datenstruktur und Verwendung können Sie Bezeichnungen auf Zeilen-, Spalten- oder Dateiebene anwenden. Bei Datenbanken können Sie ein spezielles Tool verwenden, um die Vertraulichkeit und Kritischität von Daten mit bestimmten Zeilen und Spalten zu verknüpfen. Dieser Ansatz bietet eine präzise Kontrolle über die Verwaltung und den Zugriff auf Daten.

Optimieren der Datenverwaltung

Die Datenverwaltung ist der Prozess zum Speichern, Verschieben und Sichern von Workloaddaten. Durch die Optimierung der Datenverwaltung können Sie Ausgaben an die Datenpriorität ausrichten und mehr Wert von Ihren Daten ableiten. Berücksichtigen Sie die folgenden Strategien für die Datenverwaltung.

Optimieren der Datenlebenszyklusverwaltung

Es ist wichtig, Daten während des gesamten Lebenszyklus zu verwalten. Phasen des Lebenszyklus umfassen die Erstellung von Daten (oder den Erwerb), Speicher, Nutzung, Freigabe, Aufbewahrung und Entsorgung (Löschung oder Archivierung). Ziel der Datenlebenszyklusverwaltung ist es, Datenspeicherlösungen zu optimieren und dabei relevante Vorschriften und Richtlinien einzuhalten.

Die Datenspeicherung umfasst drei wichtige Kostenkomponenten:

  • Speicherkosten: Die Kosten für das Speichern von Daten, z. B. pro Gigabyte.

  • Transaktionskosten: Kosten, die mit Datenvorgängen verknüpft sind, z. B. Schreibvorgänge, Lesevorgänge und Datenabrufe (pro Gigabyte). Das Lesen und Schreiben von Daten kann unterschiedliche Kosten haben.

  • Latenzkosten: Die Kosten, die mit der Geschwindigkeit oder Verzögerung beim Zugriff auf die Daten verbunden sind.

Die folgenden Überlegungen sind grundlegende Aspekte für die Datenlebenszyklusverwaltung:

  • Datenebenen verwenden: Ziel der Datenebenen ist es, den Zugriff und die Aufbewahrung auf die kostengünstigste Speicherebene auszurichten. Speicherebenen reichen von häufigen/unmittelbaren Zugriffen (heiß) bis hin zu seltenen/verzögerten Zugriffen (Kalt).

    Es kostet mehr, eine Ebene zu verwenden, die nicht den Anforderungen des Datenzugriffs und der Aufbewahrung entspricht. Beispielsweise sollten Daten, auf die Ihre Anwendung häufig zugreift, im Hot Storage gespeichert sein. Daten, auf die Ihre Anwendung selten zugreift, sollten im Kaltspeicher gespeichert sein. Die effektive Verwaltung dieser Aspekte trägt dazu bei, eine effiziente Datenspeicherung zu gewährleisten.

  • Berücksichtigen Sie Complianceanforderungen: Die Implementierung von Datenebenen erfordert eine sorgfältige Prüfung der Complianceanforderungen und Datengovernancerichtlinien. Compliance- und gesetzliche Anforderungen fördern häufig den Datenzugriff und die Aufbewahrung. Richten Sie Aufbewahrungsrichtlinien für Daten ein, um die Einhaltung gesetzlicher, behördlicher und geschäftlicher Anforderungen sicherzustellen.

  • Definieren sie Datenlebenszyklusrichtlinien. Datenlebenszyklusrichtlinien geben an, wann und wie Daten basierend auf vordefinierten Kriterien zwischen Speicherebenen verschoben werden sollen. Diese Richtlinien stellen sicher, dass Sie Daten für die erforderliche Dauer in der entsprechenden Ebene aufbewahren. Eine Richtlinie kann z. B. angeben, dass Daten 30 Tage lang in der heißen Ebene, in der coolen Ebene für 90 Tage und in der Archivebene für ein Jahr aufbewahrt werden müssen. Legen Sie den Aufbewahrungszeitraum basierend auf Faktoren wie gesetzlichen Anforderungen, Branchenvorschriften oder internen Richtlinien fest.

  • Verwenden Sie Automatisierung: Aufbewahrungsrichtlinien können die Verschiebung von Daten zwischen Ebenen auslösen. Sie sollten Richtlinien mithilfe von Plattformfeatures automatisieren, bevor Sie eine benutzerdefinierte Lösung erstellen.

    Wenn der Aufbewahrungszeitraum für eine bestimmte Ebene abläuft, kann die Richtlinie die Daten automatisch auf die nächste niedrigere Kostenebene verschieben. Wenn beispielsweise der Aufbewahrungszeitraum für die heiße Ebene endet, kann die Richtlinie die Daten in die kühle Ebene verschieben. Die Richtlinie stellt sicher, dass Daten kontinuierlich basierend auf ihren Zugriffsmustern und Kostenanforderungen optimiert werden.

Kompromiss: Die Verwaltung von Datenaufbewahrungsrichtlinien erfordert eine fortlaufende Überwachung und Wartung. Es kann mehr Aufwand für Datenverwaltungsprozesse verursachen. Dies kann sich auch auf die Speicherkosten auswirken. Längere Aufbewahrungszeiträume oder die Verwendung höher kostenintensiver Speicherebenen können die Speicherkosten erhöhen.

Risiko: Eine schlechte Implementierung des Datenlebenszyklusmanagements kann zu Datenverlusten oder eingeschränktem Zugriff auf kritische Daten führen. Sie sollten über geeignete Sicherungs- und Wiederherstellungsmechanismen verfügen, um das Risiko von Datenverlusten zu mindern.

Optimieren der Datensegmentierung

Die Optimierung der Datensegmentierung umfasst die strategische Organisation von Daten in unterschiedliche Segmente und konsolidieren ähnliche Datentypen, um Speicherressourcen effizient zuzuordnen. Sie können die Zuweisung von Speicherressourcen an die Datenpriorität anpassen.

Um die Datensegmentierung effektiv zu optimieren, kategorisieren Sie Daten nach Typ und Verwendungsmuster. Anschließend platzieren Sie die Datensegmente in Abhängigkeit von ihren betrieblichen Ähnlichkeiten und Anforderungen auf die effektivste Lösung. Sie platzieren z. B. Daten, die einen leistungsfähigen Speicher für Ressourcen mit schnellerer Abrufzeit erfordern. Archivierungsdaten verwenden eine kostengünstigere Ressource mit langsamerer Abrufzeit.

Mit diesem Ansatz wird sichergestellt, dass daten mit hohem Bedarf schnellere Speicherung für optimale Leistung und weniger zugriffige Daten einen günstigeren Speicher verwenden. Wenn Datentypen Nutzungsmuster gemeinsam nutzen, sollten Sie diese in einer einzigen Ressource gruppieren, um den Aufwand zu reduzieren, die Verwaltung zu vereinfachen und die Datenverarbeitung zu verbessern.

Minimieren der Datenübertragung

Die Minimierung der Datenübertragung bezieht sich auf die Reduzierung der Datenübertragung über Netzwerke hinweg, um die Kosten für die Datenübertragung zu verringern. Dadurch wird das Datenvolumen reduziert, das die Arbeitsauslastung verschiebt und die Netzwerknutzungsgebühren verringert. Um die Datenübertragung zu minimieren, sollten Sie die folgenden Empfehlungen berücksichtigen:

  • Verwenden Sie den richtigen Ort. Platzieren Sie Daten geografisch näher an den Benutzern. Die Datennähe reduziert den Netzwerkverkehr, wodurch der Zugriff beschleunigt und kostenoptimiert wird.
  • Verwenden Sie Zwischenspeicherung. Berücksichtigen Sie die Vorteile der Zwischenspeicherung, um die Datenübertragung zu minimieren.
  • Verwenden Sie ein Netzwerk für die Inhaltsübermittlung. Ein Netzwerk für die Inhaltsübermittlung kann häufig statische Daten näher an Benutzer lesen.A content delivery network can store frequently read static data closer to users. Dadurch wird die Verschiebung von Daten über das Netzwerk reduziert und die Bandbreitennutzung entlastet.

Optimieren von Sicherheit und Compliance

Bestimmte Produktionsdaten erfordern höhere Sicherheits- und Complianceanforderungen. Diese Maßnahmen können zusätzliche Kosten im Zusammenhang mit Datenschutz, Verschlüsselung, Sicherung, Aufbewahrung und Überwachung auferlegen.

Sie müssen sicherstellen, dass Änderungen an Datenspeicherlösungen diesen Anforderungen entsprechen. Daten mit niedrigeren Sicherheits- und Complianceanforderungen stellen häufig eine Möglichkeit dar, Kosten zu optimieren.

Optimieren des Datenvolumens

Das Auffinden von Strategien zur Verringerung der Datenmenge, die Sie speichern, kann dazu beitragen, die Kosten zu reduzieren. Indem Sie die Barrierefreiheit der Daten ändern und die folgenden Techniken implementieren, können Sie das Volumen Ihrer gespeicherten Daten effektiv optimieren:

  • Erfassen Sie weniger Daten: Werfen Sie einen genaueren Blick auf die Daten, die Sie erfassen. Ermitteln Sie, ob eine dieser Elemente für Ihre Zwecke nicht erforderlich ist. Ändern Sie Ihren Prozess, Ihre Einstellungen oder Konfigurationen, um nur die wesentlichen Daten zu erfassen.

  • Komprimieren von Daten: Komprimierung spart Geld, indem die Datengröße reduziert wird. Es ist am effektivsten in Schreib-, Schreib-, Nie- oder Lese-selten-Szenarien. Es eignet sich besser für kältere Lagerung.

    Kompromiss: Sowohl Komprimierung als auch Dekomprimierung von Daten erhöhen die CPU-Zeit.

  • Löschen nicht benötigter Daten: Implementieren Sie Richtlinien, um den Prozess zum Speichern relevanter Informationen zu optimieren. Bewerten Sie den Aufbewahrungszeitraum für Sicherungen und Momentaufnahmen, und löschen Sie daten, die Sie nicht mehr benötigen. Möglicherweise möchten Sie über einen Prozess verfügen, der zu einem späteren Datenlöschvorgang führt, z. B. zum ersten Archivieren von Daten und zum Aktivieren eines Vorläufigen Löschzeitraums. Berücksichtigen Sie immer die Wiederherstellbarkeit vor dem Löschen von Daten.

  • Deduplizieren von Daten: Implementieren Sie Datendeduplizierungstechniken, um redundante Daten zu beseitigen. Die Deduplizierung reduziert die Speicheranforderungen, indem Sie sicherstellen, dass Nur eindeutige Datenblöcke gespeichert werden, sodass Sie Kosten sparen. Verwenden Sie Hashingalgorithmen und vergleicht Datenblöcke. Führen Sie regelmäßig Deduplizierungsprozesse aus, um doppelte Daten zu identifizieren und zu beseitigen.

  • Optimieren des Benutzerverhaltens: Informieren Sie Benutzer in Workloads, die vom Benutzer generierte Daten sammeln, über die Bedeutung einer effizienten Datenspeicherung. Ermutigen Sie sie, unnötige Dateien und Daten regelmäßig zu überprüfen und zu löschen. Implementieren Sie Speicherkontingente oder Preismodelle, die eine übermäßige Datenspeicherung verhindern.

Optimieren der Datenreplikation

Die Datenreplikation umfasst das Erstellen mehrerer Kopien von Daten und das Speichern in anderen geografischen Standorten oder Zonen zur Zuverlässigkeit. Die Replikation stellt sicher, dass, wenn ein Standort oder eine Zone einen Fehler oder Ausfall aufweist, weiterhin auf die Daten aus den replizierten Kopien an anderen Speicherorten zugreifen können.

Diese Redundanz trägt dazu bei, die Verfügbarkeit und Resilienz von Daten zu verbessern. Es minimiert das Risiko von Datenverlust und Ausfallzeiten.

Um die Datenreplikation für die Kostenoptimierung zu optimieren, beachten Sie die folgenden Richtlinien:

  • Auswerten der Datenreplikationsanforderungen: Bewerten Sie die spezifischen Anforderungen Ihrer Workload, und bestimmen Sie die Datenreplikationsebene, die sie benötigt. Berücksichtigen Sie Faktoren wie DatenkritischeItät, Wiederherstellungszeitziele (RTOs) und Ziele des Wiederherstellungspunkts (Recovery Point Objectives, RPOs).

  • Wählen Sie die richtige Replikationsstrategie aus: Wählen Sie eine Replikationstechnologie aus, die ihren Zielen für die Kostenoptimierung entspricht. Berücksichtigen Sie die Sla-Anforderungen (Service Level Agreement) für Ihre Workload.

    Auswerten von Optionen wie synchroner Replikation, asynchroner Replikation oder einer Kombination aus beiden. Basieren Sie auf Faktoren wie Datenkonsistenzanforderungen und Überlegungen zur Netzwerkbandbreite. Bewerten Sie die Verfügbarkeitsebene, die Sie für Ihre Workload benötigen, und bewerten Sie die Notwendigkeit von Zonen- und Regionalredundanzen.

  • Optimieren sie die Netzwerkbandbreite: Minimieren Sie die Nutzung der Netzwerkbandbreite, indem Sie Komprimierungs- und Datendeduplizierungstechniken implementieren. Diese Techniken können die Menge der während der Replikation übertragenen Daten reduzieren, wodurch Kosten gespart werden können.

  • Überwachen und Optimieren der Replikationshäufigkeit: Überprüfen und anpassen Sie die Replikationshäufigkeit basierend auf den sich ändernden Anforderungen Ihrer Workload. Die Feinabstimmung der Replikationshäufigkeit kann dazu beitragen, die Kosten zu optimieren, indem der unnötige Replikationsaufwand reduziert wird.

Optimieren von Sicherungen

Eine Sicherung ist eine regelmäßige Momentaufnahme oder Kopie von Daten, die Sie separat vom primären Speicher erstellen und speichern können. Wenn Datenbeschädigung, versehentliches Löschen oder Systemfehler vorhanden sind, können Sie Sicherungen verwenden, um die Daten in den vorherigen Zustand wiederherzustellen.

Hier sind einige Techniken zum Optimieren von Sicherungen:

  • Datenklassifizierung: Klassifizieren Sie Ihre Daten basierend auf ihrer Wichtigkeit und Priorisierung für die Sicherung. Die Klassifizierung hilft Ihnen, Ressourcen auf das Sichern kritischer Daten zu konzentrieren und gleichzeitig sicherungsrelevante Kosten für Daten zu minimieren, die weniger wichtig sind.

  • Inkrementelle Sicherungen: Anstatt jedes Mal vollständige Sicherungen auszuführen, sollten Sie in Erwägung ziehen, inkrementelle Sicherungen zu implementieren. Inkrementelle Sicherungen erfassen nur Änderungen, die seit der letzten Sicherung vorgenommen wurden, wodurch speicher- und Netzwerkbandbreitenanforderungen reduziert werden können.

    Tradeoff: Inkrementelle Sicherungen erfordern mehr Schritte und Zeit zum Wiederherstellen von Daten. Sie müssen zuerst die vollständige Sicherung wiederherstellen und dann jede inkrementelle Sicherung in Sequenz anwenden, bis Sie den gewünschten Wiederherstellungspunkt erreicht haben.

  • Sicherungskomprimierung: Aktivieren Sie die Komprimierung während des Sicherungsvorgangs, um die Größe von Sicherungsdateien zu verringern. Komprimierte Sicherungen benötigen weniger Speicherplatz, sodass Sie Kosten sparen können.

  • Sicherungsspeicherebenen: Bewerten Sie Ihre Sicherungsaufbewahrungsrichtlinien und ziehen Sie in Erwägung, ältere Sicherungen auf niedrigere Speicherebenen zu verschieben, z. B. Kaltspeicher oder Archivspeicher. Das Speichern von weniger häufig aufgerufenen Sicherungen in kostengünstigen Speicheroptionen trägt zur Optimierung der Kosten bei.

  • Aufbewahrungszeitraum für Sicherungen: Überprüfen und Anpassen der Aufbewahrungszeiträume für Ihre Sicherungen basierend auf geschäftlichen Anforderungen und Compliance-Vorschriften. Die Wartung von Sicherungen für längere Dauer kann zu zusätzlichen Speicherkosten führen.

  • Sicherungshäufigkeit: Analysieren der Sicherungshäufigkeit für verschiedene Datentypen. Passen Sie den Sicherungszeitplan basierend auf der Häufigkeit von Datenänderungen und der Wichtigkeit der Daten an. Diese Methoden tragen dazu bei, unnötige Sicherungen zu beseitigen und Die Speicherkosten zu senken.

Optimieren von Dateiformaten

Dateiformate beeinflussen die Kostenoptimierung durch Optimieren von Eingabe-/Ausgabemustern (E/A) und Abfragemustern Ihrer Daten. Einige Dateiformate richten sich an bestimmte Szenarien. Durch die Ausrichtung des Dateiformats an Ihre Workloadanforderungen kann die Leistung der Workload verbessert werden.

Im Folgenden finden Sie Überlegungen zu gängigen Formaten:

  • Avro: Das Avro-Dateiformat ist eine gute Wahl, wenn Sie sich mit schreibintensiven E/A-Mustern beschäftigen oder wenn Abfragemuster mehrere Zeilen mit Datensätzen vollständig abrufen müssen. Die Serialisierungs- und Deserialisierungsprozesse von Avro sind effizient, sodass sie mit Nachrichtenbussen wie Kafka kompatibel sind, die eine Reihe von Ereignissen und Nachrichten in schneller Folge erzeugen.

  • Geparkte und optimierte Zeilenspalte (ORC): Die Dateiformate "Parkett" und "ORC" zeichnen sich in Szenarien mit leseintensiven E/A-Mustern aus, oder wenn sich die Abfragemuster auf bestimmte Spalten der Datensätze konzentrieren.

    Beide Formate sind Spaltenspeicher, was bedeutet, dass Daten spaltenweise und nicht zeilenweise gespeichert werden. Spaltenspeicher ermöglicht eine verbesserte Komprimierung und effiziente Lesevorgänge. Es müssen nur die erforderlichen Spalten abgerufen werden, sodass Sie unnötige E/A für irrelevante Daten vermeiden.

Optimieren von Speicherlösungen

Bewerten und auswählen Sie die am besten geeigneten Speichermethoden und -systeme für Ihre Daten. Dieser Aufwand kann das Wechseln von Datenbanken, das Verwenden verschiedener Speichertypen oder das Hinzufügen von Zwischenspeicherungsmechanismen umfassen. Die einfache Verwaltung ist ein weiterer Faktor, den Sie berücksichtigen sollten, wenn Sie eine Speicherlösung auswählen.

Durch die Anpassung von Speicherlösungen an die spezifischen Anforderungen und Merkmale der Daten können Sie eine bessere Kosteneffizienz erzielen und gleichzeitig die Leistungs- und Skalierbarkeitsanforderungen erfüllen. Es gibt Kosten für den Wechsel von Datenbanken oder Swappingdiensten, aber das Speichern von Daten in der falschen Speicherlösung kann Ihnen zusätzliches Geld kosten.

Hier sind einige Anwendungsfälle:

  • Wechseln von Datenbanken: Sie können in Betracht ziehen, zu einem Datenbanksystem zu wechseln, das Ihren Anforderungen besser entspricht. Wenn Sie beispielsweise eine relationale Datenbank verwenden, können Sie die Option zum Verschieben in eine NoSQL-Datenbank untersuchen, wenn Ihre Daten dokumentorientiert sind oder flexible Schemas erfordern.

  • Das Verschieben von einer relationalen Datenbank in einen Flat File-Speicher: In einigen Fällen kann das Speichern von Daten in Flachdateien anstelle einer herkömmlichen relationalen Datenbank Vorteile wie Einfachheit und Kosteneffizienz bieten. Flache Dateien eignen sich gut für bestimmte Datentypen, z. B. Protokolldateien oder Daten, die keine komplexe Abfrage erfordern. Sie können z. B. binäre Bilder in einer SQL-Datenbank speichern, aber es ist kostengünstiger, sie in einem Speicherdienst zu speichern, der speziell für die Verarbeitung von Binärdaten dient.

  • Optimieren Sie die Protokolldatenkosten mit Zusammenfassung: Bei Datenströmen mit hohem Volumen sollten Sie die Verwendung von Zusammenfassungstechniken in Betracht ziehen, um die Speicherkosten zu reduzieren und gleichzeitig analytische Funktionen aufrechtzuerhalten.

  • Der Wechsel von der Infrastruktur als Service (IaaS) zur Plattform as a Service (PaaS): IaaS-Datenbanklösungen können zeitaufwendig und ressourcenintensive Eigenschaften sein, die die Aufmerksamkeit eines technischen Teams von den Kernaufgaben ablenken. Das Wachstum des Datenvolumens und die Herausforderungen der manuellen Skalierung, Sicherungen und Infrastrukturwartung können eine PaaS-Lösung kostengünstiger und effizienter machen.

  • Hinzufügen eines Caches: Um die Ressourcennutzung auf dem Hauptdatenbankserver zu reduzieren, sollten Sie eine Cachelösung zum Zwischenspeichern komplexer Abfrageergebnisse in Betracht ziehen. Die Rechteanpassung des Datenbankservers kann bei der Optimierung der Kosten hilfreich sein. Berücksichtigen Sie bei anwendbaren Anwendungsfällen die Verwendung von Zeit für Live (TTL) mit den zwischengespeicherten Daten, um die Speicheranforderungen zu reduzieren und die Kosten zu senken.

  • Abfrageoptimierte im Vergleich zu Datenspeichern: Abfrageoptimierte Speicher sind für schnelles Abrufen und Analysieren von Daten konzipiert. Sie konzentrieren sich auf schnelle Datenaufnahme und Lesevorgänge, aber nicht häufige Updates. Sie sind ideal für Zeitreihendaten und schnellen Zugriff auf aktuelle Daten, aber nicht für schwere Transaktionsaufgaben.

    Datenspeicher verarbeiten große Datenmengen, insbesondere unstrukturierte oder semistrukturierte Daten. Obwohl Datenspeicher Analysen unterstützen können, benötigen komplexe Aufgaben möglicherweise spezielle Datenbanken. Sie sind am besten geeignet, um viele variable Daten wie Protokolle oder vom Benutzer generierte Inhalte in Szenarien wie NoSQL-Anwendungsfällen zu speichern.

Azure-Unterstützung

Erfassen von Daten: Microsoft Purview ist eine Familie von Datengovernancen, Risiken und Compliance-Lösungen, die Ihrer Organisation helfen können, Ihre gesamte Datensammlung zu steuern, zu schützen und zu verwalten. Microsoft Purview-Lösungen bieten eine integrierte Abdeckung und helfen bei der Bewältigung der jüngsten Zunahme der Remotebenutzerkonnektivität, der Fragmentierung von Daten in allen Organisationen und der Verwischen herkömmlicher IT-Verwaltungsrollen.

Optimieren der Datenverwaltung: Azure Storage und Azure Data Lake Storage weisen unterschiedliche Datenzugriffsstufen auf. Sie bieten auch Richtlinien zur Datenlebenszyklusverwaltung , die Datenebenen und Aufbewahrung automatisieren.

Sie können eine regelbasierte Richtlinie verwenden, um BLOB-Daten auf die entsprechenden Zugriffsebenen zu übertragen oder Daten am Ende des Lebenszyklus abläuft. Diese Richtlinie ermöglicht es Ihnen, Blobs von kühl (oder kalt) zu heiß zu übertragen, sobald auf sie zugegriffen wird, um die Leistung zu optimieren.

Optimieren von Sicherungen: Der Azure Backup-Dienst bietet mehrere Funktionen, um Ihre Sicherungen zu optimieren. Es bietet Features wie systemeigene Datenbanksicherung und Speichersicherung über Datenträgermomentaufnahmen. Es unterstützt die Sicherung virtueller Computer, die langfristige Aufbewahrung und die Sicherungsverwaltung.

Hier sind einige der Features des Diensts:

  • Überwachung: Sie können das Backup Center als einzelner Glasbereich verwenden, um Ihre Aufträge und Das Backup-Inventar täglich zu überwachen. Das Backup Center stellt eine Schnittstelle zu Sicherungsberichten bereit, die Azure Monitor Logs und Azure-Arbeitsmappen verwenden.

  • Berichte: Sicherungsberichte bieten die folgenden Funktionen:

    • Zuordnen und Prognostizieren des verbrauchten Cloudspeichers.
    • Überwachen sie Sicherungen und Wiederherstellungen.
    • Identifizieren Sie wichtige Trends auf verschiedenen Granularitätsebenen.
    • Gewinnen Sie Einblicke und Einblicke in Kostenoptimierungsmöglichkeiten für Ihre Sicherungen.
  • Reservierte Kapazität: Reservierte Azure Backup Storage-Kapazität bietet Ihnen einen Rabatt auf die Kapazität für Sicherungsdaten, die für die Tresorstandardebene gespeichert sind, wenn Sie sich für eine Reservierung für ein Jahr oder drei Jahre verpflichten. Eine Reservierung stellt eine feste Menge an Backup-Speicherkapazität für die Dauer der Reservierung bereit.

  • Archivebene: Sie können Azure Backup verwenden, um Sicherungsdaten zu speichern, einschließlich ltR-Sicherungsdaten (Long-Term Retention) gemäß den Aufbewahrungsanforderungen, die die Complianceregeln Ihrer Organisation definieren. In den meisten Fällen wird selten auf die älteren Sicherungsdaten zugegriffen und nur für Complianceanforderungen gespeichert. Azure Backup unterstützt die Sicherung von LTR-Punkten auf der Archivebene zusätzlich zu Momentaufnahmen und der Standardebene.

Optimieren von Speicherlösungen: Azure verfügt über viele Speicherlösungen. Sie bieten verschiedene Features und Funktionen, um Kosten basierend auf Ihren spezifischen Anforderungen zu optimieren. Azure enthält Anleitungen, die Ihnen bei der Auswahl des richtigen Datenspeichers helfen.

Um die am besten geeignete Speicherlösung und Konfiguration auszuwählen, ist es wichtig, Ihre Datenzugriffsmuster, Aufbewahrungsanforderungen und Leistungsanforderungen zu bewerten. Regelmäßige Überwachung und Optimierung Ihrer Speichernutzung mithilfe von Tools wie Azure Advisor können Sie bei der weiteren Optimierung der Kosten unterstützen.

Das Optimieren von Abfragen mit Azure Monitor Log Analytics-Zusammenfassungsregeln ermöglicht eine automatisierte Zusammenfassung von Datenströmen mit hoher Erfassungsrate über verschiedene Dienstebenen hinweg. Dieser Ansatz bietet eine kostengünstige langfristige Datenaufbewahrung, indem gestaffelte Architekturen erstellt werden, in denen detaillierte Rohdaten zu zusammengefassten Datasets für Analyse und Berichterstellung aggregiert werden, wodurch die Speicherkosten erheblich reduziert werden, während analytische Erkenntnisse erhalten bleiben.

Checkliste zur Kostenoptimierung

Lesen Sie die vollständigen Empfehlungen.