Udostępnij przez


Pomieszczenie sterylne i analiza danych wielopodmiotowych

Poufne przetwarzanie na platformie Azure (ACC) stanowi podstawę dla rozwiązań, które umożliwiają wielu stronom współpracę nad danymi. Istnieją różne podejścia do rozwiązań i rosnącego ekosystemu partnerów, które ułatwiają klientom platformy Azure, badaczom, analitykom danych i dostawcom danych współpracę nad danymi przy zachowaniu prywatności. W tym omówieniu omówiono niektóre podejścia i istniejące rozwiązania, których można użyć— wszystkie uruchomione na platformie ACC.

Jakie są zabezpieczenia danych i modeli?

Rozwiązania do czyszczenia danych zwykle oferują środki dla co najmniej jednego dostawcy danych do łączenia danych do przetwarzania. Zazwyczaj kod, zapytania lub modele tworzone przez jednego z dostawców lub innego uczestnika, takie jak badacz lub dostawca rozwiązań, są zwykle uzgadniane. W wielu przypadkach dane mogą być traktowane jako poufne i niezalecane do bezpośredniego udostępniania innym uczestnikom — czy chodzi o innego dostawcę danych, badacza czy dostawcę rozwiązań. Aby zapewnić bezpieczeństwo i prywatność zarówno danych, jak i modeli używanych w czystych salach danych, poufne przetwarzanie może służyć do kryptograficznego weryfikowania, czy uczestnicy nie mają dostępu do danych lub modeli, w tym podczas przetwarzania. Korzystając z ACC, rozwiązania mogą zapewnić ochronę danych i IP modelu przed operatorem chmury, dostawcą rozwiązań oraz uczestnikami współpracy danych.

Jakie są przykłady przypadków użycia w branży?

Dzięki ACC klienci i partnerzy tworzą wielostronne rozwiązania analizy danych, które chronią prywatność, czasami określane jako "poufne cleanroomy" – zarówno zupełnie nowe, unikatowo poufne rozwiązania, jak również istniejące cleanroomy, które stają się poufne dzięki ACC.

  • Scotiabank — Udowodniono zastosowanie sztucznej inteligencji w przepływach pieniężnych między bankami do identyfikacji prania pieniędzy oraz wykrywania przypadków handlu ludźmi, przy użyciu poufnego przetwarzania na platformie Azure i partnera rozwiązań Opaque.
  • Novartis Biome — użyła rozwiązania partnerskiego firmy BeeKeeperAI działającego na ACC w celu znalezienia kandydatów do badań klinicznych w przypadku rzadkich chorób.
  • Wiodący dostawcy płatności łączący dane między bankami w celu wykrycia oszustw i anomalii.
  • Usługi analityczne danych i rozwiązania bezpiecznego środowiska wykorzystujące ACC w celu zwiększenia ochrony danych oraz spełnienia wymagań związanych z zgodnością klientów UE i regulacjami dotyczącymi prywatności.

Dlaczego poufne przetwarzanie?

Czyszczenie danych nie jest zupełnie nową koncepcją, jednak dzięki postępom w przetwarzaniu poufnym istnieje więcej możliwości wykorzystania skali chmury z szerszymi zestawami danych, zabezpieczaniem adresów IP modeli sztucznej inteligencji i możliwością lepszego spełnienia przepisów dotyczących prywatności danych. W poprzednich przypadkach niektóre dane mogą być niedostępne z powodów, takich jak

  • Wady konkurencyjne lub regulacje uniemożliwiające udostępnianie danych między firmami branżowymi.
  • Anonimizacja zmniejszająca jakość szczegółowych informacji na temat danych lub zbyt kosztowna i czasochłonna.
  • Dane powiązane z określonymi lokalizacjami są ograniczone w przetwarzaniu w chmurze ze względu na obawy dotyczące bezpieczeństwa.
  • Kosztowne lub długie procesy prawne obejmują odpowiedzialność, jeśli dane są narażone lub nadużywane

Te realia mogą prowadzić do niekompletnych lub nieskutecznych zestawów danych, które powodują słabsze szczegółowe informacje lub więcej czasu potrzebnego do trenowania i używania modeli sztucznej inteligencji.

Jakie kwestie należy wziąć pod uwagę podczas kompilowania rozwiązania do czyszczenia?

Analiza wsadowa a potoki danych w czasie rzeczywistym: Rozmiar zestawów danych i szybkość wglądu w dane należy wziąć pod uwagę podczas projektowania lub używania rozwiązania typu cleanroom. Gdy dane są dostępne "offline", można je załadować do zweryfikowanego i zabezpieczonego środowiska obliczeniowego na potrzeby przetwarzania analitycznego danych na dużych częściach danych, jeśli nie do całego zestawu danych. Ta analiza wsadowa umożliwia ocenę dużych zestawów danych za pomocą modeli i algorytmów, które nie powinny zapewniać natychmiastowego wyniku. Na przykład analiza wsadowa działa dobrze podczas przeprowadzania wnioskowania za pomocą uczenia maszynowego na podstawie milionów rekordów medycznych w celu znalezienia najlepszych kandydatów do badań klinicznych. Inne rozwiązania wymagają wglądu w dane w czasie rzeczywistym, na przykład gdy algorytmy i modele mają na celu zidentyfikowanie oszustw dotyczących transakcji niemal w czasie rzeczywistym między wieloma jednostkami.

Udział w zerowym zaufaniu: Główną różnicą w poufnych pomieszczeniach czystych jest możliwość braku zaufania zainteresowanych stron — od wszystkich dostawców danych, deweloperów kodu i modelu, dostawców rozwiązań i administratorów operatorów infrastruktury. Rozwiązania mogą być udostępniane w przypadku, gdy zarówno dane, jak i adres IP modelu mogą być chronione przed wszystkimi stronami. Podczas dołączania lub tworzenia rozwiązania uczestnicy powinni wziąć pod uwagę zarówno to, co jest potrzebne do ochrony, jak i od kogo chronić każdy kod, modele i dane.

Uczenie federacyjne: Uczenie federacyjne obejmuje tworzenie lub używanie rozwiązania, gdzie modele przetwarzają w dzierżawie właściciela danych, a wnioski są agregowane w dzierżawie centralnej. W niektórych przypadkach modele mogą być nawet uruchamiane na danych spoza platformy Azure, a agregacja modelu nadal występuje na platformie Azure. Wiele razy uczenie federacyjne iteruje dane wiele razy, gdy parametry modelu są ulepszane po zagregowaniu szczegółowych informacji. Koszty iteracji i jakość modelu powinny być uwzględniane w rozwiązaniu oraz oczekiwane rezultaty.

Miejsce przechowywania danych i źródła: Klienci mają dane przechowywane w wielu chmurach i lokalnie. Współpraca może obejmować dane i modele z różnych źródeł. Rozwiązania do czyszczenia mogą ułatwić korzystanie z danych i modeli pochodzących z platformy Azure z tych innych lokalizacji. Gdy dane nie mogą przejść na platformę Azure z lokalnego magazynu danych, niektóre rozwiązania do czyszczenia mogą działać w lokacji, w której znajdują się dane. Zarządzanie i zasady mogą być obsługiwane przez wspólnego dostawcę rozwiązań, jeśli jest dostępny.

Integralność kodu i poufne rejestry: Dzięki technologii rozproszonej księgi (DLT) działającej w ramach przetwarzania poufnego platformy Azure można tworzyć rozwiązania działające w sieci w różnych organizacjach. Logika kodu i reguły analityczne można dodawać tylko wtedy, gdy istnieje konsensus między różnymi uczestnikami. Wszystkie aktualizacje kodu są rejestrowane w celu audytu za pośrednictwem odpornego na manipulacje rejestrowania dzięki technologii poufnego przetwarzania na platformie Azure.

Jakie są opcje rozpoczęcia pracy?

Azure Confidential Clean Rooms (wersja zapoznawcza)

Azure Confidential Clean Rooms (ACCR) są zaprojektowane dla organizacji, które muszą udostępniać wrażliwe dane dotyczące prywatności, takie jak dane osobowe (PII) lub chronione informacje o zdrowiu (PHI), bezpiecznie z innymi organizacjami w celu uzyskania istotnych biznesowo informacji, które mogą być wykorzystywane do bezpiecznego dostrajania modelu uczenia maszynowego z użyciem poufnych danych z innych organizacji celem zwiększenia dokładności lub do przeprowadzania bezpiecznej analizy wspólnych danych z organizacjami partnerskimi. Usługa ACCR używa poufnych kontenerów w usłudze Azure Container Instances, aby zapewnić ochronę danych przed innymi współpracownikami i operatorami platformy Azure. Ma aplikacje obejmujące wiele branż, takich jak opieka zdrowotna, reklama, bankowość i usługi finansowe oraz handel detaliczny.

Możesz zarejestrować się w wersji zapoznawczej accr, przesyłając ten formularz.

Oferty platformy ACC, które pomagają umożliwić poufne strefy czystości

Zwijaj rękawy i twórz rozwiązanie do czyszczenia danych bezpośrednio na tych poufnych ofertach usług obliczeniowych.

Poufne kontenery w usłudze Azure Container Instances (ACI) i maszynach wirtualnych Intel SGX z enklawami aplikacji zapewniają rozwiązanie kontenera do tworzenia poufnych rozwiązań do czyszczenia.

Poufne maszyny wirtualne zapewniają platformę maszyn wirtualnych dla poufnych rozwiązań do czyszczenia.

Usługa Azure SQL AE w bezpiecznych enklawach udostępnia usługę platformy do szyfrowania danych i zapytań w języku SQL, które mogą być używane w wielostronnej analizie danych i poufnych pomieszczeniach.

Confidential Consortium Framework to platforma typu open source służąca do tworzenia usług stanowych o wysokiej dostępności, które używają scentralizowanych obliczeń w celu ułatwienia użycia i wydajności, zapewniając jednocześnie zdecentralizowane zaufanie. Umożliwia wielu podmiotom przeprowadzanie audytowalnych obliczeń na danych poufnych bez konieczności wzajemnego zaufania lub zaufania do uprzywilejowanego operatora.

Rozwiązania partnerskie ACC, które umożliwiają poufne czyszczenie pomieszczeń

Skorzystaj z partnera, który opracował rozwiązanie do analizy danych oparte na współpracy wielu stron na platformie Azure do poufnego przetwarzania.

  • Anjuna udostępnia poufne platformy obliczeniowe w celu umożliwienia różnych przypadków użycia, w tym bezpiecznych pomieszczeń, w celu udostępniania danych do wspólnej analizy, takich jak obliczanie wyników ryzyka kredytowego lub opracowywanie modeli uczenia maszynowego bez ujawniania poufnych informacji.
  • Usługa BeeKeeperAI umożliwia korzystanie ze sztucznej inteligencji opieki zdrowotnej za pośrednictwem bezpiecznej platformy współpracy dla właścicieli algorytmów i stewardów danych. Usługa BeeKeeperAI™ korzysta z analizy chroniącej prywatność w wieloinstytucjonalnych źródłach chronionych danych w poufnym środowisku obliczeniowym. Rozwiązanie obsługuje kompleksowe szyfrowanie, bezpieczne enklawy obliczeniowe i najnowsze procesory SGX firmy Intel w celu ochrony danych i adresu IP algorytmu.
  • Usługa Decentriq udostępnia czyszczenie danych SaaS oparte na poufnych obliczeniach, które umożliwiają bezpieczną współpracę danych bez udostępniania danych. Sale czystych danych naukowych umożliwiają elastyczną analizę wielopartyjną, a sale bez kodu dla mediów i reklam pozwalają na zgodną aktywację i analizę odbiorców na podstawie danych użytkowników pierwszego stopnia. Poufne toalety zostały szczegółowo opisane w tym artykule na blogu firmy Microsoft.
  • Fortanix udostępnia platformę przetwarzania poufnego, która umożliwia poufne korzystanie ze sztucznej inteligencji, w tym wiele organizacji współpracujących ze sobą na potrzeby analizy wielostronnej.
  • Habu zapewnia międzyoperacyjną platformę clean room do analizy danych, która umożliwia firmom odblokowanie inteligencji współpracy w sposób inteligentny, bezpieczny, skalowalny i prosty. Habu łączy zdecentralizowane dane między działami, partnerami, klientami i dostawcami w celu lepszej współpracy, podejmowania decyzji i wyników.
  • Rozwiązanie Mithril Security zapewnia narzędzia ułatwiające dostawcom SaaS obsługę modeli sztucznej inteligencji wewnątrz bezpiecznych enklaw oraz zapewnienie lokalnego poziomu zabezpieczeń i kontroli właścicielom danych. Właściciele danych mogą używać swoich rozwiązań SaaS AI, zachowując zgodność i kontrolę nad danymi.
  • Opaque zapewnia poufną platformę obliczeniową do współpracy w zakresie analizy danych i AI, umożliwiając przeprowadzanie współdzielonych, skalowalnych analiz z zachowaniem pełnej ochrony danych oraz pozwalając organizacjom na zgodność z przepisami prawnymi i regulacyjnymi.