Microsoft SSIS – SQL Server Integration Services
Die ETL-Software SQL Server Integration Services, kurz SSIS, wird von der Firma Microsoft entwickelt und vertrieben. Die Integration Services stellen eine wesentliche Komponente des Microsoft SQL-Servers zur Erstellung von Data Warehouse Anwendungen dar.
Neben den Integration Services stellt Microsoft noch die SQL Server Analysis Services (SSAS) und die SQL Server Reporting Services (SSRS), zum Aufbau einer vollwertigen Business Intelligence Landschaft, zur Verfügung.Die grafische Entwicklung erfolgt mit Microsofts Visual Studio, welches um das Module der SQL Server Data Tools (SSDT) erweitert wird. Besitzt man keine Lizenz für Visual Studio, so kann eine kostenlose Version der Data Tools heruntergeladen und genutzt werden. Mit dieser Software können nur SSIS, SSAS und SSRS Projekte erstellt werden.
Benutzeroberfläche und Funktionen zur Datenintegration
Die Oberfläche unterteilt sich in drei große Bereiche. Das ist zum einen die SSIS-Toolbox, welche die SSIS-Designer Komponenten enthält. Des Weiteren steht der zentral ausgerichtet Editor zur Verfügung. Dieser verwendet grafische Notationen zur Erstellung von ETL Strecken. Die Elemente der Toolbox können mittels Drag&Drop im Editor angeordnet werden. Die Verbindung zwischen den Elementen kann der Entwickler frei setzen. Dabei unterstützt der Editor den Entwickler insofern, als dass er nicht erlaubte Verbindungen zwischen Elementen nicht erstellt.
Der Editor bezieht sich inhaltlich auf das Projekt-Package und bietet drei Register zur Entwicklung an. Dabei handelt es sich um die Ablaufsteuerung, den Datenfluss und die Parameter. Zwischen diesen gibt es eine Hierarchie.
Die einzelnen Elemente der SSIS Toolbox können individuelle Konfigurationen aufweisen. Wird ein Element im Datenflusstask angeklickt, erscheinen die editierbaren Attribute im Eigenschaftenfenster, das den dritten wesentlichen Bestandteil der Oberfläche darstellt.
Quellsystemanbindung
Mit den SQL Server Data Tools können die Microsoft-spezifischen Datenquellen, wie SQL-Server, Excel oder Access, über spezielle Treiber, die in den SSIS Komponenten integriert sind, angebunden werden. Alle anderen Quelldatensysteme werden über die standardisierte ODBC Schnittstelle angebunden.
Historisierung
In den SQL Server Data Tools ist die sehr nützliche SCD (Slowly-Changing-Dimension)-Komponente enthalten, die eine manuelle Erstellung des standardisierten Historisierungsprozesses vermeidet. Über einen Wizard angeleitet, ist es sehr einfach die Art der Historisierung festzulegen.
Workflows und Transformation
Der eigentliche Workflow wird in der Ablaufsteuerung festgelegt. In dieser werden sogenannte Datenflusstasks erstellt und miteinander verknüpft. Die Datenflusstasks (die Datenflüsse sind untergeordnet) koordinieren den Ablauf unterschiedlicher Transformationen. Die Transformationen sowie das Lesen und Schreiben von Daten aus Quell- und Zieloperatoren wird im Datenfluss erstellt. Dazu wird die Registerkarte von der Ablaufsteuerung zum Datenfluss gewechselt.
Debugging
Die SQL Server Data Tools bieten mehrere Möglichkeiten des Debugging an. So kann zwischen zwei Datenflusskomponenten ein sogenannter Data Viewer gesetzt werden. Dieser zeigt nach jedem Schritt die verarbeiteten Daten an. Die Verwendung von Data Viewer ist vor allem in der Entwicklung sehr hilfreich. Möchte man später im laufenden Betrieb über einzelne Abläufe informiert werden, kann zusätzlich ein Logging aktiviert und in eine beliebige Tabelle oder Datei gespeichert werden. Wird der Prozess manuell gestartet, kann der Entwickler zudem sehen, welche Komponente wie viele Datensätze verarbeitet und ob an einer der Komponenten ein Fehler aufgetreten ist.
Einschätzung der SQL Server Data Tools
Die SQL Server Data Tools und die damit verwendeten SQL Server Integration Services stellen eine sehr leistungsfähige ETL-Software dar, die bestens für den Aufbau von Data Warehouses in Unternehmen geeignet ist. Die Installation ist einfach und wird über einen Wizard angeleitet. Für Anwender, die noch keine Erfahrung mit Microsofts Visual Studio sammeln konnten, erscheint die Oberfläche und Konfigurationsvielfalt zunächst recht komplex. Hierfür bietet Microsoft entsprechende Tutorials an, die den Einstieg erleichtern.
Für den Einstieg sind die SQL Server Data Tools dennoch gut geeignet und können kostenlos genutzt werden. Der Vorteil besteht in der Vielfalt an Funktionen und der guten Unterstützung von Transformationen über die SSIS Komponenten.
Im Unternehmensumfeld haben sich die SQL Server Integration Services mittlerweile etablieren können. Ein großer Vorteil liegt in der Möglichkeit neue Komponenten selbst zu entwickeln oder von spezialisierten Firmen zu lizenzieren, um den individuellen Anforderungen an das eigene Data Warehouse gerecht zu werden.