Udostępnij przez


Przetwarzanie obrazów w chmurze

Interfejsy API rozpoznawania i przetwarzania obrazów umożliwiają rozpoznawanie i przetwarzanie obrazów przy użyciu uczenia maszynowego, a także wykonywanie przydatnych operacji modyfikacji obrazu.

Ten łącznik jest dostępny w następujących produktach i regionach:

Usługa Class Regions
Copilot Studio Premium Wszystkie regiony usługi Power Automate z wyjątkiem następujących:
     - Rząd USA (GCC)
     - Rząd USA (GCC High)
     - China Cloud obsługiwane przez firmę 21Vianet
     - Departament Obrony USA (DoD)
Logic Apps Standard Wszystkie regiony usługi Logic Apps z wyjątkiem następujących:
     — Regiony platformy Azure Government
     — Regiony platformy Azure (Chiny)
     - Departament Obrony USA (DoD)
Power Apps Premium Wszystkie regiony usługi Power Apps z wyjątkiem następujących:
     - Rząd USA (GCC)
     - Rząd USA (GCC High)
     - China Cloud obsługiwane przez firmę 21Vianet
     - Departament Obrony USA (DoD)
Power Automate Premium Wszystkie regiony usługi Power Automate z wyjątkiem następujących:
     - Rząd USA (GCC)
     - Rząd USA (GCC High)
     - China Cloud obsługiwane przez firmę 21Vianet
     - Departament Obrony USA (DoD)
Kontakt
adres URL https://account.cloudmersive.com/contact-support
Metadane łącznika
Publisher Cloudmersive, LLC
Witryna internetowa https://cloudmersive.com/image-recognition-and-processing-api
Zasady ochrony prywatności https://cloudmersive.com/privacy-policy

Ten łącznik ma kluczowe znaczenie dla każdej aplikacji przetwarzania obrazów w celu przetwarzania obrazów (w tym przycinania, złożonego, warstwowego, filtrowania i nie tylko), rozpoznawania obrazów za pomocą uczenia głębokiego, w tym osób, twarzy, obiektów i innych obrazów oraz konwertowania plików obrazów między formatami o bardzo wysokiej wierności. Przetwarzanie obrazów cloudmersive obejmuje szeroką gamę typowych formatów plików, w tym PNG, BMP, JPEG, WEBP, PSD i ponad 100 innych formatów plików. Bezstanowe wysokie zabezpieczenia i przetwarzanie o wysokiej wydajności zapewnia szybką wydajność i silne zabezpieczenia. Więcej informacji można uzyskać na stronie interfejsu API rozpoznawania i przetwarzania obrazów .

Aby użyć tego łącznika, potrzebujesz konta cloudmersive. Możesz zarejestrować się przy użyciu konta Microsoft lub utworzyć konto cloudmersive. Wykonaj poniższe kroki, aby uzyskać klucz interfejsu API.

Uzyskiwanie klucza interfejsu API i wpisu tajnego

  • Rejestrowanie się na koncie cloudmersive
  • Zaloguj się przy użyciu konta cloudmersive i kliknij pozycję Klucze interfejsu API

W tym miejscu możesz utworzyć i wyświetlić swoje klucze interfejsu API wymienione na stronie Klucze interfejsu API. Wystarczy skopiować i wkleić ten klucz interfejsu API do łącznika przetwarzania obrazów chmurowych.

Teraz możesz rozpocząć korzystanie z łącznika przetwarzania obrazów chmurowych.

Tworzenie połączenia

Łącznik obsługuje następujące typy uwierzytelniania:

Wartość domyślna Parametry tworzenia połączenia. Wszystkie regiony Nie można udostępniać

Domyślny

Dotyczy: wszystkie regiony

Parametry tworzenia połączenia.

Nie jest to możliwe do udostępnienia połączenie. Jeśli aplikacja power zostanie udostępniona innemu użytkownikowi, zostanie wyświetlony monit o jawne utworzenie nowego połączenia.

Name Typ Description Wymagane
Klucz interfejsu API (z https://cloudmersive.com) securestring Klucz interfejsu API dla tego interfejsu API Prawda

Limity ograniczania

Nazwa Wywołania Okres odnowienia
Wywołania interfejsu API na połączenie 100 60 sekund

Akcje

Adaptacyjne dostosowywanie kontrastu obrazu w celu bardziej atrakcyjnego i łatwego do zobaczenia

Używa Gamma, aby dostosować kontrast adaptacyjnie w sposób, w jaki ludzkie oko widzi świat. Wyniki znacznie zwiększają możliwości wyświetlania i atrakcyjność wizualną obrazu.

Despeckle, aby usunąć szum punktowy z obrazu

Usuwanie szumu punktowego/despeckle obrazu wejściowego

Dodawanie możliwego do dostosowania cienia do obrazu

Dodawanie do obrazu dostosowywalnego cienia

Konwertowanie obrazu na czarno-biały skala szarości

Usuń kolor z obrazu, konwertując na obraz w skali szarości, czarno-białej

Konwertowanie obrazu wejściowego na format GIF

Konwertuje obraz wejściowy na format GIF. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Konwertowanie obrazu wejściowego na format JPG, JPEG

Konwertuje obraz wejściowy na format JPEG/JPG. Dostosowywanie parametrów kodowania. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Konwertowanie obrazu wejściowego na format mapy bitowej BMP

Konwertuje obraz wejściowy na format PSD. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Konwertowanie obrazu wejściowego na format PNG

Konwertuje obraz wejściowy na format PNG. Przezroczystość jest zachowywana, gdy jest obecna. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Konwertowanie obrazu wejściowego na format PSD programu Photoshop

Konwertuje obraz wejściowy na format PSD. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Konwertowanie obrazu wejściowego na format TIFF

Konwertuje obraz wejściowy na format TIFF. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Konwertowanie obrazu wejściowego na format WebP

Konwertuje obraz wejściowy na format WebP. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Nie można bezpiecznie pracować klasyfikacji zawartości racy NSFW

Klasyfikuj obraz do zawartości Not Safe For Work (NSFW)/Porn/Racy i Bezpiecznej zawartości.

Normalizuje rotację obrazu i usuwa dane rotacji EXIF

Automatycznie wyorientuje obraz wejściowy na podstawie informacji EXIF, a następnie usuwa informacje EXIF. EXIF to dodatkowy zestaw informacji przechowywanych na niektórych obrazach wykonanych z aparatami telefonów komórkowych na podstawie orientacji aparatu. Dzięki normalizacji rotacji i usuwaniu danych EXIF te obrazy stają się znacznie łatwiejsze do przetworzenia.

Obracanie obrazu dowolnej liczby stopni

Obraca obraz o dowolną liczbę stopni

Opisywanie obrazu w języku naturalnym

Wygeneruj opis tekstu w języku angielskim obrazu jako zdanie.

Porównywanie i dopasowywanie twarzy

Znajdź twarze na obrazie wejściowym i porównaj je z obrazem referencyjnym, aby określić, czy istnieje dopasowanie do twarzy na obrazie odniesienia. Obraz referencyjny (drugi parametr) powinien zawierać dokładnie jedną twarz.

Przekształcanie obrazu w obraz artystyczny automatycznie

Używa uczenia maszynowego do automatycznego przekształcania obrazu w obraz artystyczny. Ze względu na głębokość przetwarzania sztucznej inteligencji, w zależności od rozmiaru obrazu ta operacja może potrwać do 20 sekund.

Przekształć obraz

Przekształć obraz przez określoną liczbę stopni

Przycinanie obrazu do prostokątnego obszaru

Przycinanie obrazu do docelowego prostokątnego obszaru

Przycinanie obrazu do twarzy przy użyciu przycinania kwadratowego

Przycinanie obrazu do twarzy (prostokątne przycinanie). Jeśli istnieje więcej niż jedna twarz, wybierz pierwszą.

Przycinanie obrazu do twarzy przy użyciu przycinania okrężnego

Przycinanie obrazu do twarzy (przycinanie okrągłe/okrągłe). Jeśli istnieje więcej niż jedna twarz, wybierz pierwszą.

Rysowanie prostokąta na obrazie

Rysuj co najmniej jeden prostokąt z dostosowanymi wizualizacjami na obrazie

Rysowanie wielokąta na obraz

Rysuj co najmniej jeden wielokąt z dostosowanymi wizualizacjami na obrazie

Rysuj tekst na obrazie

Rysuj jeden lub więcej fragmentów tekstu z dostosowanymi wizualizacjami na obrazie

Usuwanie przezroczystości z obrazu

Usuwa wszelkie aktywne przezroczystości na obrazie. Skutecznie renderuje obraz w tej samej rozdzielczości, w tym samym formacie pliku, na białym tle, co powoduje usunięcie przezroczystości.

Wykonywanie rozmycia guassian na obrazie wejściowym

Wykonywanie rozmycia gaussian na obrazie wejściowym

Wykonywanie rozmycia ruchu na obrazie wejściowym

Wykonywanie rozmycia ruchu na obrazie wejściowym pod określonym kątem

Wykrywanie drobnego tekstu na zdjęciu dokumentu

Zidentyfikuj położenie i rozmiar małego/drobnego tekstu na zdjęciu dokumentu. Zidentyfikuj lokalizację małego tekstu na zdjęciu — na przykład słowa i inne formy tekstu o wysokiej gęstości. Może być używany na skanowaniu dokumentu lub fotografii (np. aparatu smartfonowego) dokumentu, strony lub paragonu. W celach OCR — zobacz nasze interfejsy API OCR uczenia głębokiego.

Wykrywanie dużego tekstu na zdjęciu

Zidentyfikuj położenie i rozmiar dużego tekstu na zdjęciu. Zidentyfikuj lokalizację dużego tekstu na zdjęciu — na przykład znaki, tytuły itp. i inne formy dużego tekstu o niskiej gęstości. Nie nadaje się do tekstu o wysokiej gęstości (np. skanów dokumentów, paragonów itp.) do celów OCR — w przypadku OCR zobacz nasze interfejsy API OCR uczenia głębokiego.

Wykrywanie i usuwanie zdjęcia dokumentu

Wykryj i usuń zdjęcie dokumentu (np. zrobione na telefonie komórkowym) w idealnie kwadratowy obraz. Doskonale sprawdza się w przypadku aplikacji do skanowania dokumentów; po usunięciu obrazu ten obraz jest idealny do konwersji na format PDF przy użyciu interfejsu API Konwersji lub optycznego rozpoznawania znaków przy użyciu interfejsu API OCR.

Wykrywanie i wyróżnianie krawędzi na obrazie

Wykonywanie operacji wykrywania krawędzi na obrazie wejściowym

Wykrywanie i znajdowanie twarzy na obrazie

Lokalizowanie pozycji wszystkich twarzy na obrazie

Wykrywanie i znajdowanie twarzy oraz punktów orientacyjnych oczu i nosa i ust na obrazie

Lokalizowanie pozycji wszystkich twarzy na obrazie wraz z oczami, przeglądaniem oczu, składnikami nosa i ust

Wykrywanie obiektów, w tym typów i lokalizacji na obrazie

Zidentyfikuj położenie, rozmiar i opis obiektów na obrazie oraz poziom ufności rozpoznawania. Wykrywa zarówno ludzi, jak i obiekty na obrazie.

Wykrywanie osób, w tym lokalizacji na obrazie

Zidentyfikuj pozycję i rozmiar ludzi na obrazie oraz poziom ufności rozpoznawania. Osoby na obrazie nie muszą mieć do czynienia z kamerą; mogą znajdować się na odchyłych, na krawędziach itp.

Wykrywanie płci osób na obrazie

Zidentyfikuj płeć, pozycję i rozmiar ludzkich twarzy na obrazie oraz poziom ufności rozpoznawania. Osoby na obrazie powinny stanąć przed kamerą.

Wykrywanie tablic rejestracyjnych pojazdów na obrazie

Zidentyfikuj położenie i rozmiar oraz zawartość tablic rejestracyjnych pojazdów na obrazie. Tablice rejestracyjne powinny mieścić się na osi 15–20 stopni do kamery.

Wykrywanie wieku osób na obrazie

Zidentyfikuj wiek, położenie i rozmiar ludzkich twarzy na obrazie oraz poziom ufności rozpoznawania. Osoby na obrazie nie muszą mieć do czynienia z kamerą; mogą znajdować się na odchyłych, na krawędziach itp.

Wytłania obraz

Wykonywanie operacji tłoczenia na obrazie wejściowym

Zasyfikuj obraz, zmniejszając różne kolory

Zmniejsz unikatową liczbę kolorów na obrazie do określonego poziomu

Zmienianie rozmiaru obrazu

Zmienianie rozmiaru obrazu na określoną szerokość i konkretną wysokość

Zmienianie rozmiaru obrazu przy zachowaniu współczynnika proporcji

Zmień rozmiar obrazu na maksymalną szerokość i maksymalną wysokość, zachowując oryginalny współczynnik proporcji obrazu

Znajdowanie lokalizacji symbolu na obrazie

Ustal, czy obraz zawiera symbol, a jeśli tak, lokalizację tego symbolu na obrazie.

Zwraca dominujące kolory obrazu

Używa zaawansowanego przetwarzania obrazów do wyodrębniania 5 dominujących kolorów na obrazie, zwróconych w kolejności dominacji z najbardziej dominującym kolorem. Są to podstawowe kolory perceptualne używane na obrazie jako postrzegane przez widza.

Zwraca metadane obrazu, w tym EXIF i rozdzielczość

Zwraca informacje o metadanych na obrazie, w tym typ pliku, EXIF (jeśli jest dostępny) i rozdzielczość.

Złożone dwa obrazy razem

Składa się ze sobą dwa obrazy wejściowe; obraz warstwowy na obraz podstawowy. Pierwszy wejściowy obraz to obraz podstawowy. Drugi obraz (obraz warstwowy) zostanie złożony na podstawie tego obrazu podstawowego. Obsługuje przezroczystość PNG. Aby kontrolować dopełnienie, możesz uwzględnić przezroczyste piksele na obramowaniach obrazów warstwowych odpowiednio.

Adaptacyjne dostosowywanie kontrastu obrazu w celu bardziej atrakcyjnego i łatwego do zobaczenia

Używa Gamma, aby dostosować kontrast adaptacyjnie w sposób, w jaki ludzkie oko widzi świat. Wyniki znacznie zwiększają możliwości wyświetlania i atrakcyjność wizualną obrazu.

Parametry

Nazwa Klucz Wymagane Typ Opis
Wartość gamma, aby dostosować kontrast na obrazie. Zalecana wartość to...
gamma True double

Wartość gamma, aby dostosować kontrast na obrazie. Zalecana wartość to...

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Despeckle, aby usunąć szum punktowy z obrazu

Usuwanie szumu punktowego/despeckle obrazu wejściowego

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Dodawanie możliwego do dostosowania cienia do obrazu

Dodawanie do obrazu dostosowywalnego cienia

Parametry

Nazwa Klucz Wymagane Typ Opis
Przesunięcie w poziomie (X) cienia kropli
X True integer

Przesunięcie w poziomie (X) cienia kropli

Przesunięcie w pionie (Y) cienia kropli
Y True integer

Przesunięcie w pionie (Y) cienia kropli

Sigma (odległość rozmycia) cienia kropli
sigma True integer

Sigma (odległość rozmycia) cienia kropli

Nieprzezroczystość cienia; 0 to 0%, a 100 to 100%
opacity True integer

Nieprzezroczystość cienia; 0 to 0%, a 100 to 100%

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Konwertowanie obrazu na czarno-biały skala szarości

Usuń kolor z obrazu, konwertując na obraz w skali szarości, czarno-białej

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Konwertowanie obrazu wejściowego na format GIF

Konwertuje obraz wejściowy na format GIF. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Konwertowanie obrazu wejściowego na format JPG, JPEG

Konwertuje obraz wejściowy na format JPEG/JPG. Dostosowywanie parametrów kodowania. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Parametry

Nazwa Klucz Wymagane Typ Opis
Ustaw poziom jakości JPEG; najniższa jakość to 1 (najwyższa kompresja),...
quality True integer

Ustaw poziom jakości JPEG; najniższa jakość to 1 (najwyższa kompresja),...

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Konwertowanie obrazu wejściowego na format mapy bitowej BMP

Konwertuje obraz wejściowy na format PSD. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Konwertowanie obrazu wejściowego na format PNG

Konwertuje obraz wejściowy na format PNG. Przezroczystość jest zachowywana, gdy jest obecna. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Konwertowanie obrazu wejściowego na format PSD programu Photoshop

Konwertuje obraz wejściowy na format PSD. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Konwertowanie obrazu wejściowego na format TIFF

Konwertuje obraz wejściowy na format TIFF. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Konwertowanie obrazu wejściowego na format WebP

Konwertuje obraz wejściowy na format WebP. Obsługiwane formaty plików wejściowych obejmują AAI, ART, ARW, AVS, BPG, BMP, BMP2, BMP3, BRF, CALS, CGM, CIN, CMYK, CMYKA, CR2, CRW, CUR, CUT, DCM, DCR, DCX, DDS, DIB, DJVU, DNG, DOT, DPX, EMF, EPDF, EPI, EPS2, EPS2, EPS3, EPSF, EPSI, EPT, EXR, FAKS, FIG, FITS, FPX, GIF, GPLT, GRAY, HDR, HEIC, HPGL, HRZ, ICO, ISOBRL, ISLBR6, JBIG, JNG, JP2, JPT, J2C, J2K, JPEG/JPG, JXR, MAT, MONO, MNG, M2V, MRW, MTV, NEF, ORF, OTB, P7, PALM, PAM, PBM, PCD, PCDS, PCL, PCX, PDF, PEF, PES, PFA, PFB, PFM, PGM, PICON, PICT, PIX, PNG, PNG8, PNG00, PNG24, PNG32, PNG48, PNG64, PNM, PPM, PSB, PSD, PTIF, PWB, RAD, RAF, RGB, RGBA, RGF, RLA, RLE, SCT, SFW, SGI, SID, SUN, SVG, TGA, TIFF, TIM, UIL, VIFF, VICAR, VBMP, WDP, WEBP, WPG, X, XBM, XCF, XPM, XWD, X3F, YCbCr, YCbCrA, YUV.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Nie można bezpiecznie pracować klasyfikacji zawartości racy NSFW

Klasyfikuj obraz do zawartości Not Safe For Work (NSFW)/Porn/Racy i Bezpiecznej zawartości.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik klasyfikacji NSFW

Body
NsfwResult

Normalizuje rotację obrazu i usuwa dane rotacji EXIF

Automatycznie wyorientuje obraz wejściowy na podstawie informacji EXIF, a następnie usuwa informacje EXIF. EXIF to dodatkowy zestaw informacji przechowywanych na niektórych obrazach wykonanych z aparatami telefonów komórkowych na podstawie orientacji aparatu. Dzięki normalizacji rotacji i usuwaniu danych EXIF te obrazy stają się znacznie łatwiejsze do przetworzenia.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Obracanie obrazu dowolnej liczby stopni

Obraca obraz o dowolną liczbę stopni

Parametry

Nazwa Klucz Wymagane Typ Opis
Stopnie obracania obrazu; zakres wartości z zakresu od 0,0 do 360,0.
degrees True double

Stopnie obracania obrazu; zakres wartości z zakresu od 0,0 do 360,0.

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Opisywanie obrazu w języku naturalnym

Wygeneruj opis tekstu w języku angielskim obrazu jako zdanie.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik rozpoznawania obrazu

Porównywanie i dopasowywanie twarzy

Znajdź twarze na obrazie wejściowym i porównaj je z obrazem referencyjnym, aby określić, czy istnieje dopasowanie do twarzy na obrazie odniesienia. Obraz referencyjny (drugi parametr) powinien zawierać dokładnie jedną twarz.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji; ten obraz może zawierać jeden lub ...
inputImage True file

Plik obrazu do wykonania operacji; ten obraz może zawierać jeden lub ...

Obraz przedstawiający jedną twarz do porównania i dopasowania.
matchFace True file

Obraz przedstawiający jedną twarz do porównania i dopasowania.

Zwraca

Wyniki porównywania/dopasowywania twarzy na obrazie

Przekształcanie obrazu w obraz artystyczny automatycznie

Używa uczenia maszynowego do automatycznego przekształcania obrazu w obraz artystyczny. Ze względu na głębokość przetwarzania sztucznej inteligencji, w zależności od rozmiaru obrazu ta operacja może potrwać do 20 sekund.

Parametry

Nazwa Klucz Wymagane Typ Opis
Styl obrazu do zastosowania. Aby rozpocząć, spróbuj "udnie" obraz ...
style True string

Styl obrazu do zastosowania. Aby rozpocząć, spróbuj "udnie" obraz ...

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Przekształć obraz

Przekształć obraz przez określoną liczbę stopni

Parametry

Nazwa Klucz Wymagane Typ Opis
Stopnie wirowania
degrees True integer

Stopnie wirowania

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Przycinanie obrazu do prostokątnego obszaru

Przycinanie obrazu do docelowego prostokątnego obszaru

Parametry

Nazwa Klucz Wymagane Typ Opis
Lewa krawędź prostokątnego obszaru przycinania w pikselach (X).
left True integer

Lewa krawędź prostokątnego obszaru przycinania w pikselach (X).

Górna krawędź prostokątnego obszaru przycinania w pikselach (Y).
top True integer

Górna krawędź prostokątnego obszaru przycinania w pikselach (Y).

Szerokość prostokątnego obszaru przycinania w pikselach.
width True integer

Szerokość prostokątnego obszaru przycinania w pikselach.

Wysokość prostokątnego obszaru przycinania w pikselach.
height True integer

Wysokość prostokątnego obszaru przycinania w pikselach.

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Przycinanie obrazu do twarzy przy użyciu przycinania kwadratowego

Przycinanie obrazu do twarzy (prostokątne przycinanie). Jeśli istnieje więcej niż jedna twarz, wybierz pierwszą.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Przycinanie obrazu do twarzy przy użyciu przycinania okrężnego

Przycinanie obrazu do twarzy (przycinanie okrągłe/okrągłe). Jeśli istnieje więcej niż jedna twarz, wybierz pierwszą.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Rysowanie prostokąta na obrazie

Rysuj co najmniej jeden prostokąt z dostosowanymi wizualizacjami na obrazie

Parametry

Nazwa Klucz Wymagane Typ Opis
BaseImageBytes
BaseImageBytes byte

Obraz do rysowania prostokątów w bajtach. Możesz również użyć elementu BaseImageUrl, aby podać dane wejściowe obrazu jako adres URL

BaseImageUrl
BaseImageUrl string

Obraz do rysowania prostokątów jako w pełni kwalifikowanego adresu URL HTTP lub HTTPS

BorderColor
BorderColor string

Kolor obramowania do użycia — może być wartością szesnastkową (z #) lub nazwą wspólnego koloru HTML. Obsługiwane są kolory przezroczyste.

BorderWidth
BorderWidth double

Szerokość w pikselach obramowania. Przekaż wartość 0, aby narysować prostokąt bez obramowania

FillColor
FillColor string

Kolor wypełnienia do użycia — może być wartością szesnastkową (z #) lub nazwą pospolitą HTML. Obsługiwane są kolory przezroczyste. Pozostaw pole puste, aby nie wypełniać prostokąta.

Wysokość
Height double

Wysokość w pikselach prostokąta

Szerokość
Width double

Szerokość w pikselach prostokąta

X
X double

Lokalizacja pikseli lewej krawędzi prostokąta

Y
Y double

Lokalizacja pikseli górnej krawędzi prostokąta

Zwraca

response
binary

Rysowanie wielokąta na obraz

Rysuj co najmniej jeden wielokąt z dostosowanymi wizualizacjami na obrazie

Parametry

Nazwa Klucz Wymagane Typ Opis
BaseImageBytes
BaseImageBytes byte

Obraz do rysowania wielokątów w bajtach. Możesz również użyć elementu BaseImageUrl, aby podać dane wejściowe obrazu jako adres URL

BaseImageUrl
BaseImageUrl string

Obraz do rysowania wielokątów jako w pełni kwalifikowanego adresu URL HTTP lub HTTPS

BorderColor
BorderColor string

Kolor obramowania do użycia — może być wartością szesnastkową (z #) lub nazwą wspólnego koloru HTML. Obsługiwane są kolory przezroczyste.

BorderWidth
BorderWidth double

Szerokość w pikselach obramowania. Przekaż wartość 0, aby narysować wielokąt bez obramowania

FillColor
FillColor string

Kolor wypełnienia do użycia — może być wartością szesnastkową (z #) lub nazwą pospolitą HTML. Obsługiwane są kolory przezroczyste. Pozostaw pole puste, aby nie wypełnić wielokąta.

X
X double

Lokalizacja X w pikselach tego punktu w wielokącie

Y
Y double

Lokalizacja Y w pikselach tego punktu w wielokącie

Zwraca

response
binary

Rysuj tekst na obrazie

Rysuj jeden lub więcej fragmentów tekstu z dostosowanymi wizualizacjami na obrazie

Parametry

Nazwa Klucz Wymagane Typ Opis
BaseImageBytes
BaseImageBytes byte

Obraz do rysowania tekstu w bajtach. Możesz również użyć elementu BaseImageUrl, aby podać dane wejściowe obrazu jako adres URL

BaseImageUrl
BaseImageUrl string

Obraz do rysowania tekstu jako w pełni kwalifikowanego adresu URL HTTP lub HTTPS

Kolor
Color string

Kolor do użycia — może być wartością szesnastkową (z #) lub nazwą wspólnego koloru HTML

FontFamilyName
FontFamilyName string

Rodzina czcionek do użycia. Pozostaw wartość pustą, aby ustawić domyślną wartość "Arial".

Rozmiar czcionki
FontSize double

Rozmiar czcionki do użycia.

Wysokość
Height double

Wysokość w pikselach pola tekstowego w celu narysowania tekstu; tekst zostanie zawijany wewnątrz tego pola

Tekst
Text string

Ciąg tekstowy do rysowania

Szerokość
Width double

Szerokość w pikselach pola tekstowego, aby narysować tekst; tekst zostanie zawijany wewnątrz tego pola

X
X double

Lokalizacja pikseli lewej krawędzi lokalizacji tekstu

Y
Y double

Lokalizacja pikseli górnej krawędzi lokalizacji tekstu

Zwraca

response
binary

Usuwanie przezroczystości z obrazu

Usuwa wszelkie aktywne przezroczystości na obrazie. Skutecznie renderuje obraz w tej samej rozdzielczości, w tym samym formacie pliku, na białym tle, co powoduje usunięcie przezroczystości.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Wykonywanie rozmycia guassian na obrazie wejściowym

Wykonywanie rozmycia gaussian na obrazie wejściowym

Parametry

Nazwa Klucz Wymagane Typ Opis
Promień w pikselach operacji rozmycia; większy promień spowoduje...
radius True integer

Promień w pikselach operacji rozmycia; większy promień spowoduje...

Sigma lub wariancja operacji rozmycia gaussian
sigma True integer

Sigma lub wariancja operacji rozmycia gaussian

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Wykonywanie rozmycia ruchu na obrazie wejściowym

Wykonywanie rozmycia ruchu na obrazie wejściowym pod określonym kątem

Parametry

Nazwa Klucz Wymagane Typ Opis
Promień w pikselach operacji rozmycia; większy promień spowoduje...
radius True integer

Promień w pikselach operacji rozmycia; większy promień spowoduje...

Sigma lub wariancja operacji rozmycia ruchu
sigma True integer

Sigma lub wariancja operacji rozmycia ruchu

Kąt rozmycia ruchu w stopniach
angle True integer

Kąt rozmycia ruchu w stopniach

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Wykrywanie drobnego tekstu na zdjęciu dokumentu

Zidentyfikuj położenie i rozmiar małego/drobnego tekstu na zdjęciu dokumentu. Zidentyfikuj lokalizację małego tekstu na zdjęciu — na przykład słowa i inne formy tekstu o wysokiej gęstości. Może być używany na skanowaniu dokumentu lub fotografii (np. aparatu smartfonowego) dokumentu, strony lub paragonu. W celach OCR — zobacz nasze interfejsy API OCR uczenia głębokiego.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik operacji wykrywania tekstu na zdjęciu

Wykrywanie dużego tekstu na zdjęciu

Zidentyfikuj położenie i rozmiar dużego tekstu na zdjęciu. Zidentyfikuj lokalizację dużego tekstu na zdjęciu — na przykład znaki, tytuły itp. i inne formy dużego tekstu o niskiej gęstości. Nie nadaje się do tekstu o wysokiej gęstości (np. skanów dokumentów, paragonów itp.) do celów OCR — w przypadku OCR zobacz nasze interfejsy API OCR uczenia głębokiego.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik operacji wykrywania tekstu na zdjęciu

Wykrywanie i usuwanie zdjęcia dokumentu

Wykryj i usuń zdjęcie dokumentu (np. zrobione na telefonie komórkowym) w idealnie kwadratowy obraz. Doskonale sprawdza się w przypadku aplikacji do skanowania dokumentów; po usunięciu obrazu ten obraz jest idealny do konwersji na format PDF przy użyciu interfejsu API Konwersji lub optycznego rozpoznawania znaków przy użyciu interfejsu API OCR.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Opcjonalne, efekty po przetwarzaniu, które mają być stosowane do wiadomości e-mail, wartość domyślna to Nie...
PostProcessingEffect string

Opcjonalne, efekty po przetwarzaniu, które mają być stosowane do wiadomości e-mail, wartość domyślna to Nie...

Zwraca

response
binary

Wykrywanie i wyróżnianie krawędzi na obrazie

Wykonywanie operacji wykrywania krawędzi na obrazie wejściowym

Parametry

Nazwa Klucz Wymagane Typ Opis
Promień w pikselach operacji wykrywania krawędzi; większy promień...
radius True integer

Promień w pikselach operacji wykrywania krawędzi; większy promień...

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Wykrywanie i znajdowanie twarzy na obrazie

Lokalizowanie pozycji wszystkich twarzy na obrazie

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wyniki lokalizowania twarzy na obrazie

Wykrywanie i znajdowanie twarzy oraz punktów orientacyjnych oczu i nosa i ust na obrazie

Lokalizowanie pozycji wszystkich twarzy na obrazie wraz z oczami, przeglądaniem oczu, składnikami nosa i ust

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wyniki lokalizowania twarzy na obrazie

Wykrywanie obiektów, w tym typów i lokalizacji na obrazie

Zidentyfikuj położenie, rozmiar i opis obiektów na obrazie oraz poziom ufności rozpoznawania. Wykrywa zarówno ludzi, jak i obiekty na obrazie.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik wykrywania obiektów na obrazie

Wykrywanie osób, w tym lokalizacji na obrazie

Zidentyfikuj pozycję i rozmiar ludzi na obrazie oraz poziom ufności rozpoznawania. Osoby na obrazie nie muszą mieć do czynienia z kamerą; mogą znajdować się na odchyłych, na krawędziach itp.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik wykrywania obiektów na obrazie

Wykrywanie płci osób na obrazie

Zidentyfikuj płeć, pozycję i rozmiar ludzkich twarzy na obrazie oraz poziom ufności rozpoznawania. Osoby na obrazie powinny stanąć przed kamerą.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik klasyfikowania płci osób na obrazie

Wykrywanie tablic rejestracyjnych pojazdów na obrazie

Zidentyfikuj położenie i rozmiar oraz zawartość tablic rejestracyjnych pojazdów na obrazie. Tablice rejestracyjne powinny mieścić się na osi 15–20 stopni do kamery.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik wykrywania tablic rejestracyjnych pojazdów na obrazie

Wykrywanie wieku osób na obrazie

Zidentyfikuj wiek, położenie i rozmiar ludzkich twarzy na obrazie oraz poziom ufności rozpoznawania. Osoby na obrazie nie muszą mieć do czynienia z kamerą; mogą znajdować się na odchyłych, na krawędziach itp.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik klasyfikowania wieku osób na obrazie

Wytłania obraz

Wykonywanie operacji tłoczenia na obrazie wejściowym

Parametry

Nazwa Klucz Wymagane Typ Opis
Promień w pikselach operacji tłoczenia; większy promień będzie produkować...
radius True integer

Promień w pikselach operacji tłoczenia; większy promień będzie produkować...

Sigma lub wariancja operacji wytłoczenia
sigma True integer

Sigma lub wariancja operacji wytłoczenia

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Zasyfikuj obraz, zmniejszając różne kolory

Zmniejsz unikatową liczbę kolorów na obrazie do określonego poziomu

Parametry

Nazwa Klucz Wymagane Typ Opis
Liczba unikatowych kolorów do zachowania w obrazie wyjściowym
levels True integer

Liczba unikatowych kolorów do zachowania w obrazie wyjściowym

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Zmienianie rozmiaru obrazu

Zmienianie rozmiaru obrazu na określoną szerokość i konkretną wysokość

Parametry

Nazwa Klucz Wymagane Typ Opis
Szerokość obrazu wyjściowego — końcowy obraz będzie dokładnie taka szerokość
width True integer

Szerokość obrazu wyjściowego — końcowy obraz będzie dokładnie taka szerokość

Wysokość obrazu wyjściowego — ostateczny obraz będzie dokładnie taki wysokości
height True integer

Wysokość obrazu wyjściowego — ostateczny obraz będzie dokładnie taki wysokości

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Zmienianie rozmiaru obrazu przy zachowaniu współczynnika proporcji

Zmień rozmiar obrazu na maksymalną szerokość i maksymalną wysokość, zachowując oryginalny współczynnik proporcji obrazu

Parametry

Nazwa Klucz Wymagane Typ Opis
Maksymalna szerokość obrazu wyjściowego — ostateczny obraz będzie tak duży jak po...
maxWidth True integer

Maksymalna szerokość obrazu wyjściowego — ostateczny obraz będzie tak duży jak po...

Maksymalna wysokość obrazu wyjściowego — końcowy obraz będzie tak duży jak p...
maxHeight True integer

Maksymalna wysokość obrazu wyjściowego — końcowy obraz będzie tak duży jak p...

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

response
binary

Znajdowanie lokalizacji symbolu na obrazie

Ustal, czy obraz zawiera symbol, a jeśli tak, lokalizację tego symbolu na obrazie.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wyszukania obrazu docelowego.
inputImage True file

Plik obrazu do wyszukania obrazu docelowego.

Obraz do znalezienia na obrazie wejściowym.
targetImage True file

Obraz do znalezienia na obrazie wejściowym.

Zwraca

Wynik operacji znajdowania symbolu na obrazie wejściowym

Zwraca dominujące kolory obrazu

Używa zaawansowanego przetwarzania obrazów do wyodrębniania 5 dominujących kolorów na obrazie, zwróconych w kolejności dominacji z najbardziej dominującym kolorem. Są to podstawowe kolory perceptualne używane na obrazie jako postrzegane przez widza.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Wynik wykonania operacji uzyskania dominującego koloru

Zwraca metadane obrazu, w tym EXIF i rozdzielczość

Zwraca informacje o metadanych na obrazie, w tym typ pliku, EXIF (jeśli jest dostępny) i rozdzielczość.

Parametry

Nazwa Klucz Wymagane Typ Opis
Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
imageFile True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Zwraca

Metadane z obrazu

Złożone dwa obrazy razem

Składa się ze sobą dwa obrazy wejściowe; obraz warstwowy na obraz podstawowy. Pierwszy wejściowy obraz to obraz podstawowy. Drugi obraz (obraz warstwowy) zostanie złożony na podstawie tego obrazu podstawowego. Obsługuje przezroczystość PNG. Aby kontrolować dopełnienie, możesz uwzględnić przezroczyste piksele na obramowaniach obrazów warstwowych odpowiednio.

Parametry

Nazwa Klucz Wymagane Typ Opis
Lokalizacja do złożonego obrazów warstwowych; możliwe wartości to: "wyśrodkowanie...
location True string

Lokalizacja do złożonego obrazów warstwowych; możliwe wartości to: "wyśrodkowanie...

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...
baseImage True file

Plik obrazu do wykonania operacji. Typowe formaty plików, takie jak P...

Obraz do warstwy na górze obrazu podstawowego.
layeredImage True file

Obraz do warstwy na górze obrazu podstawowego.

Zwraca

response
binary

Definicje

AgeDetectionResult

Wynik klasyfikowania wieku osób na obrazie

Nazwa Ścieżka Typ Opis
Osobydentyfikowane
PeopleIdentified integer

Liczba osób zidentyfikowanych na obrazie z wiekiem

PeopleWithAge
PeopleWithAge array of PersonWithAge

Osoby na obrazie oznaczone adnotacjami z informacjami o wieku

Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

ColorResult

Pojedynczy kolor

Nazwa Ścieżka Typ Opis
B
B integer

Niebieska (B) wartość piksela kanału tego koloru

G
G integer

Zielona (G) wartość piksela kanału tego koloru

R
R integer

Czerwona (R) wartość piksela kanału tego koloru

DetectedLicensePlate

Tablica rejestracyjna znaleziona na obrazie

Nazwa Ścieżka Typ Opis
Wysokość
Height integer

Wysokość położenia tablicy rejestracyjnej w pikselach

LicensePlateRecognitionConfidenceLevel
LicensePlateRecognitionConfidenceLevel double

Wskaźnik ufności dla zakresu od 0,0 do 1,0 dokładności wykrytego tablicy rejestracyjnej, z wyższymi wynikami jest lepszy; wartości o wartościach 0,75 są duże

LicensePlateText_BestMatch
LicensePlateText_BestMatch string

Tekst z tablicy rejestracyjnej, wynik najwyższej pewności

LicensePlateText_RunnerUp
LicensePlateText_RunnerUp string

Alternatywny tekst z tablicy rejestracyjnej na podstawie drugiego najwyższego wyniku ufności

LokalizacjaX
LocationX integer

X położenie lewej krawędzi tablicy rejestracyjnej, począwszy od lewej krawędzi zdjęcia (X = 0)

Lokalizacja
LocationY integer

Y położenie górnej krawędzi tablicy rejestracyjnej, począwszy od górnej krawędzi zdjęcia (Y = 0)

Szerokość
Width integer

Szerokość położenia tablicy rejestracyjnej w pikselach

DetectedObject

Pojedyncze wystąpienie obiektu i skojarzone szczegóły wykryte na obrazie

Nazwa Ścieżka Typ Opis
Wysokość
Height integer

Wysokość obiektu w pikselach

ObjectClassName
ObjectClassName string

Klasa obiektu. Przykładowe wartości to "person", "car", "dining table" itp.

Score
Score double

Współczynnik ufności wykrytego obiektu; możliwe wartości mają od 0,0 do 1,0; wartości zbliżone do 1,0 są większe ufności

Szerokość
Width integer

Szerokość obiektu w pikselach

X
X integer

Lokalizacja X w pikselach po lewej stronie obiektu, z prawej strony to X + Szerokość

Y
Y integer

Lokalizacja Y, w pikselach, w górnej lokalizacji obiektu, z dolną stroną Y + Wysokość

DominantColorResult

Wynik wykonania operacji uzyskania dominującego koloru

Nazwa Ścieżka Typ Opis
DominantColors
DominantColors array of ColorResult

Kolory dominujące na obrazie w kolejności, w której najbardziej dominujący kolor znajduje się na pierwszej pozycji indeksu (0), drugi najbardziej dominujący kolor znajduje się na pozycji indeksu 1 itd.

Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

rozpoznawanie twarzy

Lokalizacja jednej twarzy na obrazie

Nazwa Ścieżka Typ Opis
Dno
BottomY integer

Współrzędna Y z dolnej strony twarzy

LeftX
LeftX integer

Współrzędna X lewej strony twarzy

RightX
RightX integer

Współrzędna X po prawej stronie twarzy

TopY
TopY integer

Współrzędna Y górnej części twarzy

FaceCompareResponse

Wyniki porównywania/dopasowywania twarzy na obrazie

Nazwa Ścieżka Typ Opis
ErrorDetails
ErrorDetails string

Szczegóły błędów, które wystąpiły

FaceCount
FaceCount integer

Liczba twarzy znalezionych na obrazie

Faces
Faces array of FaceMatch

Tablica twarzy znalezionych na obrazie wejściowym

Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

FaceLocateResponse

Wyniki lokalizowania twarzy na obrazie

Nazwa Ścieżka Typ Opis
ErrorDetails
ErrorDetails string

Szczegóły błędów, które wystąpiły

FaceCount
FaceCount integer

Liczba twarzy znalezionych na obrazie

Faces
Faces array of Face

Tablica twarzy znalezionych na obrazie

Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

FaceLocateWithLandmarksResponse

Wyniki lokalizowania twarzy na obrazie

Nazwa Ścieżka Typ Opis
ErrorDetails
ErrorDetails string

Szczegóły błędów, które wystąpiły

FaceCount
FaceCount integer

Liczba twarzy znalezionych na obrazie

Faces
Faces array of FaceWithLandmarks

Tablica twarzy znalezionych na obrazie

Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

FaceMatch

Lokalizacja jednej twarzy na obrazie wraz z wynikami dopasowania

Nazwa Ścieżka Typ Opis
Dno
BottomY integer

Współrzędna Y z dolnej strony twarzy

HighConfidenceMatch
HighConfidenceMatch boolean

Wartość True, jeśli istnieje dopasowanie wysokiej ufności, w przeciwnym razie wartość false

LeftX
LeftX integer

Współrzędna X lewej strony twarzy

MatchScore
MatchScore double

Wynik dopasowania z zakresu od 0,0 do 1,0 z wyższymi wynikami wskazującymi większe dopasowanie; wyniki powyżej 0,7 wskazują dopasowanie

RightX
RightX integer

Współrzędna X po prawej stronie twarzy

TopY
TopY integer

Współrzędna Y górnej części twarzy

FacePoint

Lokalizacja punktu w obrębie twarzy

Nazwa Ścieżka Typ Opis
X
X integer

Lokalizacja X, gdzie 0 jest najwięcej pikseli po lewej stronie

Y
Y integer

Lokalizacja Y, gdzie 0 jest najbardziej pikselem

Znaki FaceWithLandmarks

Lokalizacja jednej twarzy na obrazie

Nazwa Ścieżka Typ Opis
BottomAndSidesOfFace
BottomAndSidesOfFace array of FacePoint

Położenie punktów dolnej i boków twarzy (policzek i podbródek)

Dno
BottomY integer

Współrzędna Y z dolnej strony twarzy

LeftEye
LeftEye array of FacePoint

Lokalizacje punktów lewego oka (oko znajdujące się najbliżej lewej strony obrazu)

LeftEyebrow
LeftEyebrow array of FacePoint

Punkty lokalizacji lewej brwi (brwi najbłodsze do lewej strony obrazu)

LeftX
LeftX integer

Współrzędna X lewej strony twarzy

LipsInnerOutline
LipsInnerOutline array of FacePoint

Lokalizacje punktów wewnętrznego konturu ust

LipsOuterOutline
LipsOuterOutline array of FacePoint

Lokalizacje punktów zewnętrznego konturu ust

NoseBottom
NoseBottom array of FacePoint

Lokalizacje punktów dna (nozdrzy) nosa

NoseBridge
NoseBridge array of FacePoint

Punkty położenia mostka nosowego (pionowa część nosa)

RightEye
RightEye array of FacePoint

Punktowe lokalizacje prawego oka (oko znajdujące się najbliżej prawej strony obrazu)

RightEyebrow
RightEyebrow array of FacePoint

Punkty lokalizacji prawej brwi (brwi najbłodsze do prawej strony obrazu)

RightX
RightX integer

Współrzędna X po prawej stronie twarzy

TopY
TopY integer

Współrzędna Y górnej części twarzy

FindSymbolResult

Wynik operacji znajdowania symbolu na obrazie wejściowym

Nazwa Ścieżka Typ Opis
Wysokość
Height integer

Wysokość znalezionej lokalizacji w pikselach

MatchScore
MatchScore double

Wynik z zakresu od 0,0 do 1,0, który mierzy, jak blisko pasuje symbol; wyniki powyżej 0,2 są dobre

Zakończone powodzeniem
Successful boolean

Wartość True, jeśli powodzenie, fałsz— w przeciwnym razie

Szerokość
Width integer

Szerokość znalezionej lokalizacji w pikselach

XLeft
XLeft integer

Lokalizacja X lewej krawędzi znalezionej lokalizacji w pikselach

YTop
YTop integer

Lokalizacja Y górnej krawędzi znalezionej lokalizacji w pikselach

FineTextDetectionResult

Wynik operacji wykrywania tekstu na zdjęciu

Nazwa Ścieżka Typ Opis
Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

TextItems
TextItems array of FineTextItem

Elementy tekstowe znalezione na obrazie wejściowym

TextItemsCount
TextItemsCount integer

Liczba elementów tekstowych znalezionych na obrazie wejściowym

FineTextItem

Pojedyncze wystąpienie tekstu występującego na obrazie; jeden fragment tekstu

Nazwa Ścieżka Typ Opis
Kąt
Angle double

Kąt obrotu w radianach tekstu

BottomLeftX
BottomLeftX integer

Współrzędna X lokalizacji tekstu dolnego/lewego; 0 reprezentuje lewą krawędź obrazu wejściowego

BottomLeftY
BottomLeftY integer

Współrzędna Y lokalizacji tekstu dolnego/lewego; 0 reprezentuje górną krawędź obrazu wejściowego

BottomRightX
BottomRightX integer

Współrzędna X lokalizacji tekstu dolnego/prawego; 0 reprezentuje lewą krawędź obrazu wejściowego

BottomRighty
BottomRightY integer

Współrzędna Y w prawej/dolnej lokalizacji tekstu; 0 reprezentuje górną krawędź obrazu wejściowego

Wysokość
Height integer

Wysokość w pikselach tekstu

TopLeftX
TopLeftX integer

Współrzędna X lokalizacji tekstu górnego/lewego; 0 reprezentuje lewą krawędź obrazu wejściowego

TopLeftY
TopLeftY integer

Współrzędna Y lokalizacji tekstu górnego/lewego; 0 reprezentuje górną krawędź obrazu wejściowego

TopRightX
TopRightX integer

Współrzędna X lokalizacji tekstu u góry/prawej; 0 reprezentuje lewą krawędź obrazu wejściowego

TopRighty
TopRightY integer

Współrzędna Y w prawej/górnej lokalizacji tekstu; 0 reprezentuje górną krawędź obrazu wejściowego

Szerokość
Width integer

Szerokość w pikselach tekstu

GenderDetectionResult

Wynik klasyfikowania płci osób na obrazie

Nazwa Ścieżka Typ Opis
Osobydentyfikowane
PeopleIdentified integer

Liczba osób zidentyfikowanych na obrazie z płcią

PersonWithGender
PersonWithGender array of PersonWithGender

Osoby na obrazie oznaczone adnotacjami z informacjami o płci

Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

ImageDescriptionResponse

Wynik rozpoznawania obrazu

Nazwa Ścieżka Typ Opis
BestOutcome
BestOutcome RecognitionOutcome

Konkretny wynik rozpoznawania

Wysokakonfikcja
Highconfidence boolean

Czy wynikowy najlepszy wynik jest rozpoznawany jako wynik wysokiej ufności?

RunnerUpOutcome
RunnerUpOutcome RecognitionOutcome

Konkretny wynik rozpoznawania

Zakończone powodzeniem
Successful boolean

Czy obraz został pomyślnie przetworzony?

ImageMetadata

Metadane z obrazu

Nazwa Ścieżka Typ Opis
BitDepth
BitDepth integer

Bity na piksel

Przestrzeń kolorów
ColorSpace string

Kolorowa przestrzeń obrazu

ExifProfileName
ExifProfileName string

Nazwa używanego profilu EXIF

ExifValues
ExifValues array of ImageMetadataExifValue

Tagi i wartości EXIF osadzone na obrazie

Format pliku
FileFormat string

Format pliku obrazu

Wysokość
Height integer

Wysokość obrazu w pikselach

Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

Szerokość
Width integer

Szerokość obrazu w pikselach

ImageMetadataExifValue

Tag i wartość EXIF

Nazwa Ścieżka Typ Opis
Typ danych
DataType string

Typ daty wartości EXIF

DataValue
DataValue string

Wartość sformatowana jako ciąg wartości EXIF

Tag
Tag string

Nazwa tagu dla wartości EXIF

NsfwResult

Wynik klasyfikacji NSFW

Nazwa Ścieżka Typ Opis
ClassificationOutcome
ClassificationOutcome string

Wynik klasyfikacji na cztery kategorie: SafeContent_HighProbability, UnsafeContent_HighProbability, RacyContent, SafeContent_ModerateProbability

Score
Score double

Wynik z zakresu od 0,0 do 1,0. Wyniki 0,0–0,2 reprezentują bezpieczną zawartość o wysokim prawdopodobieństwie, a wyniki 0,8–1,0 reprezentują niebezpieczną zawartość o wysokim prawdopodobieństwie. Zawartość z zakresu od 0.2 do 0.8 jest coraz bardziej rasowa.

Zakończone powodzeniem
Successful boolean

Prawda, jeśli klasyfikacja została pomyślnie uruchomiona, w przeciwnym razie wartość false

ObjectDetectionResult

Wynik wykrywania obiektów na obrazie

Nazwa Ścieżka Typ Opis
ObjectCount
ObjectCount integer

Liczba obiektów wykrytych w scenie

Objects
Objects array of DetectedObject

Tablica obiektów wykrytych w scenie

Zakończone powodzeniem
Successful boolean

Czy obraz został pomyślnie przetworzony?

PersonWithAge

Osoba zidentyfikowana w operacji klasyfikacji wiekowej obrazu

Nazwa Ścieżka Typ Opis
Wiek
Age double
AgeClass
AgeClass string

Klasyfikacja zakresu wiekowego osoby powoduje lata; możliwe wartości to "0-2", "4-6", "8-13", "15-20", "25-32", "38-43", "48-53", "60+"

AgeClassificationConfidence
AgeClassificationConfidence double

Poziom ufności klasyfikacji wiekowej; możliwe wartości mają od 0,0 do 1,0; wyższa jest lepsza, a wartości > 0,50 są wysoce ufne

Rozpoznawanie twarzy
FaceLocation Face

Lokalizacja jednej twarzy na obrazie

PersonWithGender

Osoba zidentyfikowana w operacji klasyfikacji płci obrazu

Nazwa Ścieżka Typ Opis
Rozpoznawanie twarzy
FaceLocation Face

Lokalizacja jednej twarzy na obrazie

GenderClass
GenderClass string

Zidentyfikowana płeć osoby; możliwe wartości to "Male", "Female" i "Unknown"

GenderClassificationConfidence
GenderClassificationConfidence double

Poziom ufności klasyfikacji płci; możliwe wartości mają od 0,0 do 1,0; wyższa jest lepsza, a wartości > 0,50 są wysoce ufne

RecognitionOutcome

Konkretny wynik rozpoznawania

Nazwa Ścieżka Typ Opis
ConfidenceScore
ConfidenceScore double

Wyniki bliżej 1 są lepsze niż wyniki bliżej 0

Description
Description string

Opis obrazu w języku angielskim

TextDetectionResult

Wynik operacji wykrywania tekstu na zdjęciu

Nazwa Ścieżka Typ Opis
Zakończone powodzeniem
Successful boolean

Prawda, jeśli operacja zakończyła się pomyślnie, w przeciwnym razie wartość false

TextItems
TextItems array of TextItem

Elementy tekstowe znalezione na obrazie wejściowym

TextItemsCount
TextItemsCount integer

Liczba elementów tekstowych znalezionych na obrazie wejściowym

TextItem

Pojedyncze wystąpienie tekstu występującego na obrazie; jeden fragment tekstu

Nazwa Ścieżka Typ Opis
Wysokość
Height integer

Wysokość w pikselach elementu tekstowego

LeftX
LeftX integer

Lewa współrzędna X lokalizacji tekstu; 0 reprezentuje lewą krawędź obrazu wejściowego

TopY
TopY integer

Współrzędna Y górnej lokalizacji tekstu; 0 reprezentuje górną krawędź obrazu wejściowego

Szerokość
Width integer

Szerokość w pikselach elementu tekstowego

VehicleLicensePlateDetectionResult

Wynik wykrywania tablic rejestracyjnych pojazdów na obrazie

Nazwa Ścieżka Typ Opis
DetectedLicensePlateCount
DetectedLicensePlateCount integer

Liczba tablic rejestracyjnych wykrytych na obrazie

DetectedLicensePlates
DetectedLicensePlates array of DetectedLicensePlate

Tablice rejestracyjne znalezione na obrazie

Zakończone powodzeniem
Successful boolean

Czy obraz został pomyślnie przetworzony?

binarny

Jest to podstawowy typ danych "binary".