Startseite » Datenbank Lexikon » Klassifikation

Klassifikation

Die Klassifikation von Objekten wird häufig mit der Clusteranalyse verwechselt oder Synonym verwendet, dabei steckt hinter der Klassifikation ein anderer Ansatz und eine andere Vorgehensweise.

Der Unterschied besteht darin, dass bei der Klassifikation, Objekte mit ähnlichen Merkmalsausprägungen einer vordefinierten Klasse zugeordnet werden.

Beim Clustern hingegen, werden, aufgrund von Merkmalsausprägungen einer Anzahl von Objekten, neue Klassen ermittelt und anschließend festgelegt (siehe Clusteranalyse).

Vorgehensweise bei der Objektklassifizierung

Bei der Klassifikation von Objekten werden zwei Phasen durchlaufen, die sogenannte Lernphase und die Klassifikationsphase.

In der Lernphase werden Objekte aus der Datenbasis nach dem Zufallsprinzip ausgewählt und für das trainieren eines Modells verwendet. Bei jedem dieser ausgewählten Objekte, muss bereits zu Beginn des Trainings bekannt gegeben werden, in welche Klasse es einzuordnen ist.

Dadurch können mithilfe der Merkmalsausprägungen, Entscheidungsregeln für das Modell ermittelt und geprüft werden, die zu der bereits bekannten Klasse führen. Dies ist wichtig, um überprüfen zu können, ob die Algorithmen korrekt erstellt wurden und bereits bekannte Klassifikationen richtig erkannt werden.

Klassifikation Lernphase | Datenbank Lexikon

Das ermittelte Modell sollte auf seine Richtigkeit und Robustheit überprüft werden, um die Daten sinnvoll automatisiert klassifizieren zu können.

In der Klassifikationsphase werden die Regeln des Modells auf die Datenmenge angewandt. Aufgrund der Merkmalsausprägungen wird zu jedem Objekt eine Klasse ermittelt und das Objekt dieser Klasse zugeordnet.

Klassifikation Klassifikationsphase | Datenbank Lexikon

Ansätze der Klassifizierung

Es gibt vier wesentliche Verfahren bei der Klassifikation von Objekten. Diese sind Entscheidungsbäume, Neuronale Netze, die Bayes-Klassifikation und das Nächste-Nachbarn-Verfahren. Diese Verfahren sind nach dem bereits erwähnten zweistufigen Prinzip einer Lern- und einer Klassifikationsphase aufgebaut, unterscheiden sich jedoch sehr stark bei der Erstellung des Modells.

Anwendungsgebiet der Klassifikation

Die Klassifikation eignet sich gut, wenn es um Mustererkennung geht und eine Entscheidung, über die Einordnung eines Objektes, durch einen Satz von Regeln erfolgen kann. Anwendung finden die Klassifikations-Verfahren beispielsweise bei der Schriftenerkennung, der Vorgangserkennung und der Kundenprüfung. Besonders im Finanzsektor kann hierdurch geprüft werden, ob ein Kunde kreditwürdig ist, ein Betrugsfall oder Geldwäsche vorliegt.

In Kombination mit der Clusteranalyse, kann die Klassifikation dazu verwendet werden, das Clustern nachvollziehbar und damit fachlich überprüfbar zu machen.

Weiterführende Artikel

Autor: Mandy
5 Bewertungen 1 Stern2 Sterne3 Sterne4 Sterne5 Sterne
Loading...
0