Einleitung

Abgeschlossen

Die Computervision ist einer der Kernbereiche der künstlichen Intelligenz (AI) und konzentriert sich auf die Erstellung von Lösungen, mit denen KI-Anwendungen visuelle Informationen verarbeiten können.

Betrachten Sie folgende Szenarios:

  • Ein autonomes Fahrzeug muss Verkehr und Fußgänger erkennen und darauf reagieren.
  • Ein Geschäft verwendet intelligente Auscheckvorgänge mit Kameras, um die Produkte im Warenkorb eines Kunden zu bestimmen.
  • Eine Türglockenkamera wird verwendet, um Personen an Ihrer Tür zu erkennen.

Diese Anwendungsfälle und viele andere verlassen sich auf Computervisionen.

Natürlich haben Computer keine biologischen Augen, die so funktionieren, wie wir es tun, aber sie sind in der Lage, Bilder zu verarbeiten; entweder aus einem Live-Kamerafeed oder aus digitalen Fotos oder Videos. Diese Fähigkeit, Bilder zu verarbeiten, ist der Schlüssel zum Erstellen von Software, die die menschliche visuelle Wahrnehmung emulieren kann. In diesem Modul untersuchen wir die Bausteine, die moderne Computer-Vision-Lösungen zugrunde legen.

Hinweis

Wir erkennen, dass verschiedene Menschen gerne auf unterschiedliche Weise lernen. Sie können dieses Modul im videobasierten Format abschließen oder den Inhalt als Text und Bilder lesen. Der Text enthält größere Details als die Videos. In einigen Fällen sollten Sie also auf den Text als ergänzendes Material für die Videopräsentation verweisen.