Wie Machine Vision visuelle Daten verarbeitet
Typische Machine-Vision-Systeme folgen einer Verarbeitungskette aus Bildaufnahme, Vorverarbeitung, Merkmalsextraktion und Auswertung. Je nach Aufgabe kommen klassische Verfahren der Bildverarbeitung, statistische Modelle oder lernbasierte Ansätze zum Einsatz. Die Ergebnisse können etwa Klassifikationen, Positionsangaben, Segmentierungen, Zählwerte oder erkannte Abweichungen sein. Entscheidend ist, dass aus visuellen Rohdaten eine maschinell nutzbare Aussage abgeleitet wird.
Typische Anwendungsfelder von Machine Vision
Machine Vision wird eingesetzt, wenn visuelle Merkmale zuverlässig und wiederholbar erkannt oder geprüft werden sollen. Dazu gehören unter anderem Qualitätskontrollen in der Produktion, Objekterkennung in Logistik und Robotik, Dokumenten- und Texterkennung, Verkehrsanalysen sowie die Auswertung medizinischer oder technischer Bilddaten. Auch in digitalen Produkten kann Machine Vision Bestandteil von Funktionen wie Bilderkennung, visueller Suche oder automatischer Inhaltsanalyse sein.
Verfahren und Ausprägungen in der Praxis
Je nach Anwendungsfall reicht das Spektrum von regelbasierten Prüfungen mit klar definierten Merkmalen bis zu trainierten Modellen für komplexe Bildinhalte. Häufige Aufgaben sind Bildklassifikation, Objektdetektion, Segmentierung, Tracking, OCR und Anomalieerkennung. Technisch kann mit 2D-Bildern, Videoströmen oder Tiefeninformationen gearbeitet werden. Die konkrete Ausprägung hängt davon ab, ob einzelne Objekte erkannt, Szenen interpretiert oder Veränderungen über die Zeit verfolgt werden sollen.
Einordnung innerhalb von KI und Abgrenzung zu verwandten Leistungen
Machine Vision ist innerhalb der Künstlichen Intelligenz auf visuelle Daten ausgerichtet. Im Unterschied zu Machine Learning als übergeordneter Methodenkategorie beschreibt Machine Vision primär den Anwendungsbereich rund um Bilder und Video. Deep Learning ist davon abzugrenzen, weil es eine technische Herangehensweise ist, die in Machine-Vision-Projekten oft verwendet wird, aber nicht mit der Leistung selbst gleichzusetzen ist. Gegenüber Geschwisterleistungen wie Chatbots, Text Analytics & NLP oder Virtual Agents verarbeitet Machine Vision keine Sprache oder Dialoge, sondern Bildinformationen.