Delen via


Inleiding tot analyses op cloudschaal

Analyse op cloudschaal bouwt voort op Azure-landingszones om de implementatie en governance te vereenvoudigen. Het belangrijkste doel van een Azure-landingszone is ervoor te zorgen dat de vereiste infrastructuur al aanwezig is wanneer u een toepassing of workload in Azure implementeert. Voordat u uw landingszone voor analyse op cloudschaal implementeert, moet u het Cloud Adoption Framework voor Azure uitvoeren om een Architectuur voor een Azure-landingszone met platformlandingszones te implementeren.

Voor soevereine workloads biedt Microsoft de Sovereign Landing Zone (SLZ), een variant van de Azure-landingszone. De SLZ is bedoeld voor organisaties die geavanceerde onafhankelijke controles nodig hebben. Analyse op cloudschaal kan worden geïmplementeerd op basis van deze Azure-landingszonevariant.

Analyse op cloudschaal omvat het implementeren van landingszones voor toepassingen. Deze zones bevinden zich doorgaans onder de beheergroep van de landingszone. Beleidsregels hebben invloed op de voorbeeldsjablonen die Microsoft biedt.

U kunt deze voorbeeldsjablonen gebruiken voor uw data lakehouse- en data mesh-implementaties .

Evaluatie van analyses op cloudschaal

Vaak zoekt een bedrijf duidelijkheid of prescriptieve richtlijnen voordat deze begint met het definiëren van de technische details voor een specifieke use case of project, of voor end-to-end analyses op cloudschaal. Aangezien een bedrijf zijn algehele gegevensstrategie formuleert, kan het lastig zijn om ervoor te zorgen dat alle vereiste en strategische principes binnen het bereik van het huidige gebruik in aanmerking worden genomen.

Om de levering van deze end-to-end-implementatie van inzichten te versnellen, terwijl rekening wordt gehouden met deze uitdagingen, heeft Microsoft een prescriptief scenario ontwikkeld voor analyses op cloudschaal. Het is afgestemd op de belangrijkste thema's die worden besproken in Een plan ontwikkelen voor analyses op cloudschaal.

Analyse op cloudschaal bouwt voort op het Cloud Adoption Framework en past de principes van het Azure Well-Architected Framework toe. Het Cloud Adoption Framework biedt beschrijvende richtlijnen en best practices voor cloudbesturingssystemen, referentiearchitecturen en platformsjablonen. Deze richtlijnen zijn gebaseerd op ervaringen in de praktijk van een aantal van onze meest uitdagende, geavanceerde en complexe omgevingen.

Met analyses op cloudschaal kunt u zich voorbereiden op het bouwen en operationeel maken van landingszones om analyseworkloads te hosten en uit te voeren. U bouwt de landingszones op basis van verbeterde beveiliging, governance en naleving. Landingszones zijn schaalbaar en modulair, maar ondersteunen autonomie en innovatie.

Geschiedenis van gegevensarchitectuur

In de late jaren 1980 werd datawarehouse generatie 1 geïntroduceerd. Dit model combineert verschillende gegevensbronnen vanuit een onderneming. Eind jaren 2000 is generatie 2 ontstaan, met de introductie van big data-ecosystemen zoals Hadoop en data lakes. Halverwege de jaren 2010 werd het cloudgegevensplatform geïntroduceerd: streaminggegevensinname met architecturen zoals Kappa of Lambda. In het begin van de jaren 2020 zijn data lakehouses, data meshes, data fabrics en gegevensgerichte operationele patronen geïntroduceerd.

Ondanks deze ontwikkelingen gebruiken veel organisaties nog steeds het gecentraliseerde monolithische platform: generatie 1. Dit systeem werkt goed, tot een punt. Knelpunten kunnen echter optreden vanwege onderling afhankelijke processen, nauw gekoppelde onderdelen en hyperspecialiseerde teams. ETL-taken (Extract, Transform, and Load) kunnen prominent worden en leveringstijdlijnen vertragen.

Datawarehouses en data lakes zijn nog steeds waardevol en spelen een belangrijke rol in uw algehele architectuur. In de volgende documentatie worden enkele van de uitdagingen beschreven die kunnen optreden wanneer u deze traditionele procedures voor schalen gebruikt. Deze uitdagingen zijn vooral relevant in een complexe organisatie, waarbij gegevensbronnen, vereisten, teams en uitvoer veranderen.

Overstappen op analyses op cloudschaal

Uw huidige analytische gegevensarchitectuur en operationele model kunnen structuren zoals een datawarehouse, data lake, en data lakehouse bevatten, evenals een data fabric of data mesh.

Elk gegevensmodel heeft zijn eigen voordelen en uitdagingen. Met analyses op cloudschaal kunt u uw huidige benadering van gegevensbeheer verschuiven, zodat deze zich kan ontwikkelen met uw infrastructuur.

U kunt elk gegevensplatform en scenario ondersteunen om een end-to-end analyseframework op cloudschaal te maken dat als basis fungeert en schaalaanpassing mogelijk maakt.

Modern gegevensplatform en gewenste resultaten

Een van de eerste stappen is het activeren van uw gegevensstrategie om te voldoen aan uw uitdagingen door iteratief een schaalbaar en flexibel modern gegevensplatform te bouwen.

In plaats van overweldigd te worden met servicetickets en te voldoen aan concurrerende zakelijke behoeften, kunt u, wanneer u een modern gegevensplatform implementeert, een meer adviserende rol spelen, omdat u uw tijd kunt vrijmaken om u te concentreren op waardevoller werk. U levert bedrijfslijnen met het platform en de systemen voor selfservice voor gegevens- en analysebehoeften.

Hieronder worden aanbevolen gebieden met de eerste focus:

  • Verbeter de gegevenskwaliteit, faciliteer vertrouwen en krijg inzichten om gegevensgestuurde zakelijke beslissingen te nemen.
  • Implementeer holistische gegevens, beheer en analyses op schaal, binnen uw organisatie.
  • Stel robuuste gegevensbeheer in die selfservice en flexibiliteit mogelijk maakt voor bedrijfslijnen.
  • Behoud beveiliging en juridische naleving in een volledig geïntegreerde omgeving.
  • Maak snel de basis voor geavanceerde analysemogelijkheden met behulp van een out-of-the-box-oplossing van goed ontworpen, herhaalbare, modulaire patronen.

Uw analyseomgeving beheren

Een tweede overweging is om te bepalen hoe uw organisatie gegevensbeheer implementeert.

Gegevensbeheer is het proces om ervoor te zorgen dat de gegevens die u gebruikt in uw bedrijfsactiviteiten, rapporten en analyses, detecteerbaar, nauwkeurig, vertrouwd zijn en dat deze kunnen worden beveiligd.

Voor veel bedrijven is de verwachting dat gegevens en AI een concurrentievoordeel zullen opleveren. Als gevolg hiervan willen leidinggevenden AI-initiatieven sponsoren in hun vastberadenheid om gegevensgestuurd te worden. Ai moet echter vertrouwde gegevens gebruiken om effectief te zijn. Anders kan de nauwkeurigheid van beslissingen worden aangetast, kunnen beslissingen worden vertraagd of worden acties gemist, wat van invloed kan zijn op het resultaat. Bedrijven willen niet dat de kwaliteit van hun gegevens slecht is. Totdat u het effect van de digitale transformatie op gegevens bekijkt, lijkt het misschien eenvoudig om de gegevenskwaliteit te herstellen.

Organisaties die gegevens hebben verspreid over een hybride multicloud en een gedistribueerd-gegevenslandschap, hebben moeite om te vinden waar hun gegevens zich bevinden en om ze te beheren. Ongereguleerde gegevens kunnen een aanzienlijk effect hebben op een organisatie. Slechte gegevenskwaliteit is van invloed op bedrijfsactiviteiten omdat gegevensfouten procesfouten en vertragingen veroorzaken. Slechte gegevenskwaliteit is ook van invloed op zakelijke besluitvorming en de mogelijkheid om compatibel te blijven. Het garanderen van gegevenskwaliteit bij de bron heeft vaak de voorkeur omdat het oplossen van kwaliteitsproblemen in het analytische systeem complexer en kostbaar kan zijn dan het toepassen van gegevenskwaliteitsregels vroeg in de opnamefase. Voor het bijhouden en beheren van gegevensactiviteit moet gegevensbeheer het volgende omvatten:

  • Gegevensdetectie.
  • Gegevenskwaliteit.
  • Het maken van beleid.
  • Delen van gegevens.
  • Metagegevens.

Uw analyseomgeving beveiligen

Een ander belangrijk stuurprogramma voor gegevensbeheer is gegevensbeveiliging. Gegevensbescherming kan u helpen ervoor te zorgen dat u voldoet aan de regelgeving en gegevensschendingen kunt voorkomen. Gegevensprivacy en het groeiende aantal schendingen van gegevens hebben gegevensbescherming een hoogste prioriteit gemaakt. Gegevensschendingen benadrukken het risico op gevoelige gegevens, zoals persoonlijk identificeerbare klantgegevens. De gevolgen van schending van gegevensprivacy of een inbreuk op de gegevensbeveiliging kunnen zijn:

  • Ernstige schade aan merkafbeelding.
  • Verlies van klantvertrouwen en marktaandeel.
  • Een verlaging van de aandelenprijs, die van invloed is op het rendement van belanghebbenden op investeringen en leidinggevende salarissen.
  • Aanzienlijke financiële sancties vanwege audit- of nalevingsfouten.
  • Juridische actie.
  • Secundaire effecten van de inbreuk, bijvoorbeeld, kunnen klanten slachtoffer worden van identiteitsdiefstal.

In de meeste gevallen moeten openbaar genoteerde bedrijven schendingen verklaren. Als er schendingen optreden, krijgen klanten waarschijnlijk de schuld van het bedrijf in plaats van de hacker. Klanten zouden het bedrijf enkele maanden kunnen boycotten of misschien nooit meer terugkomen.

Het niet naleven van regelgeving op het gebied van gegevensprivacy kan leiden tot aanzienlijke financiële sancties. Door uw gegevens te beheren, kunt u deze risico's voorkomen.

Operationeel model en voordelen

Het overstappen op een modern datastrategieplatform verandert niet alleen de technologie die uw organisatie gebruikt. Ook wordt de werking van de organisatie gewijzigd.

Analyses op cloudschaal bieden richtlijnen voor het organiseren en trainen van uw werknemers, waaronder:

  • Persona-, rol- en verantwoordelijkheidsdefinities.
  • Voorgestelde structuren voor flexibele, verticale en cross-domain teams.
  • Trainingsbronnen, waaronder Azure-gegevens en AI-certificeringen via Microsoft Learn.

Het is ook belangrijk om uw eindgebruikers te betrekken tijdens het moderniseringsproces en naarmate u uw platform verder ontwikkelt en nieuwe gebruiksvoorbeelden onboardt.

Architecturen

Azure-landingszones vertegenwoordigen het strategische ontwerppad en de technische doelstatus voor uw omgeving. Ze maken implementatie en governance eenvoudiger, zodat u de flexibiliteit en naleving kunt verbeteren. Ze zorgen er ook voor dat wanneer er een nieuwe toepassing of workload wordt toegevoegd aan uw omgeving, de juiste infrastructuur al aanwezig is. Azure Data Management- en Data Landing Zones, geïntegreerd met SaaS-governance- en analyseoplossingen (Software as a Service) van Microsoft, zijn ontworpen met deze fundamentele principes in gedachten en kunnen, in combinatie met de andere elementen van analyses op cloudschaal, helpen bij het inschakelen van:

  • Zelfbediening.
  • Scalability.
  • Een snelle start.
  • Beveiliging.
  • Privacy.
  • Geoptimaliseerde bewerkingen.

Landingszone voor gegevensbeheer

De landingszone voor gegevensbeheer biedt de basis voor het gecentraliseerde gegevensbeheer en -beheer van uw platform in uw organisatie. Het vereenvoudigt ook communicatie om gegevens op te nemen uit uw hele digitale activa, waaronder multicloud- en hybride infrastructuren.

De landingszone voor gegevensbeheer ondersteunt tal van andere mogelijkheden voor gegevensbeheer en governance, zoals:

  • Gegevenscatalogussen.
  • Beheer van gegevenskwaliteit.
  • Gegevensclassificatie.
  • Gegevensherkomst.
  • Opslagplaatsen voor gegevensmodellering.
  • API-catalogi.
  • Gegevens delen en contracten.

Tip

Als u partneroplossingen gebruikt voor gegevenscatalogus, gegevenskwaliteitsbeheer of mogelijkheden voor gegevensherkomst, moeten ze zich in de landingszone voor gegevensbeheer bevinden. U kunt Microsoft Purview ook implementeren als een SaaS-oplossing, waarmee u verbinding maakt met zowel de landingszone voor gegevensbeheer als de landingszones voor gegevens.

Zones voor gegevenslanding

Gegevenslandingszones brengen gegevens dichter bij gebruikers en maken selfservice mogelijk en onderhouden gemeenschappelijk beheer en beheer via verbinding met de landingszone voor gegevensbeheer.

Ze hosten standaardservices zoals netwerken, bewaking en gegevensopname en -verwerking, naast aanpassingen zoals gegevensproducten en visualisaties.

Landingszones voor gegevens zijn essentieel om de schaalbaarheid van uw platform mogelijk te maken. Afhankelijk van de grootte en behoeften van uw organisatie, kunt u beginnen met een of meer landingszones.

Wanneer u besluit tussen één en meerdere landingszones, moet u rekening houden met regionale afhankelijkheden en vereisten voor gegevenslocatie. Zijn er bijvoorbeeld lokale wetten of voorschriften die vereisen dat gegevens op een specifieke locatie blijven?

Ongeacht uw eerste beslissing kunt u waar nodig gegevenslandingszones toevoegen of verwijderen. Als u met één landingszone begint, raden we u aan om uit te breiden naar meerdere landingszones om toekomstige migratiebehoeften te voorkomen.

Notitie

Waar Microsoft Fabric wordt geïmplementeerd, host de datalandingszone niet-SaaS-oplossingen, zoals data lakes en andere Azure-gegevensservices.

Zie Azure-landingszones voor analyses op cloudschaal voor meer informatie over landingszones.

Conclusie

Nadat u deze documentatie hebt gelezen, met name de secties governance, beveiliging, werking en aanbevolen procedures, raden we u aan een proof-of-concept-omgeving in te stellen met behulp van de implementatiesjablonen. Deze sjablonen, samen met architectuurrichtlijnen, bieden u praktische ervaring met enkele van de Azure- en Microsoft SaaS-technologieën. Zie de controlelijst Aan de slag voor meer informatie.

Volgende stap