Startseite » Datenbank Lexikon » U-SQL

U-SQL

U-SQL ist eine Sprache, welche die Vorteile von SQL mit der Ausdrucksstärke eigenen Codes vereint.

Sie wurde von Microsoft entwickelt und dient hauptsächlich dem Zweck, Big Data auf den Azure Data Lake Stores zu analysieren und Mehrwert daraus zu generieren.

Dazu bedient sich die Abfragesprache syntaktischer Ausdrücke aus der Programmiersprache C#. Auf diese Weise werden die Vorteile beider Welten vereint und Big Data kann mit nur einer Programmiersprache von Anfang bis Ende verarbeitet werden.

Worin liegt der Unterschied von U-SQL zu SQL?

SQL und U-SQL sind nicht grundlegend verschieden. Vielmehr ist U-SQL als Erweiterung der klassischen Abfragen anzusehen. Dabei werden klassische SQL Abfragen durch eigens entwickelte Funktionen, geschrieben in C#, erweitert. Auf diese Weise wird eine vollständige Verarbeitung von Daten ermöglicht, anstatt linearer Datenabfragen.

Diese Vorgehensweise behebt einige Probleme früherer Sprachen auf Basis von SQL. So wird die schwer zugängliche Erweiterbarkeit für unstrukturierte Daten durch benutzerdefinierten C# Code deutlich vereinfacht. Zudem steigert dieser Ansatz die Konsistenz im Bezug auf klassische Modelle der Programmierung.

Was macht U-SQL so interessant?

Ein bisher häufig auftretendes Problem in der Welt von Big Data ist die Weiterverarbeitung der Daten. Auf Programmcode basierende Lösungen sind sehr leistungsstark, erfordern aber viel Einarbeitungszeit.

Demgegenüber stehen bisher Tools auf Basis von SQL. Sie sind einfach in der Verwendung, Erweiterungen sind jedoch schwer umsetzbar. Genau an dieser Stelle setzt U-SQL an und verbindet die Vorteile beider Welten, um zeitgleich viele Nachteile auszuräumen.

Viele Entwickler finden sich schnell ein, Kenntnisse in SQL und C# vorausgesetzt. Diese Verbindung bringt noch weitere Vorteile mit. Datenabfragen können von jeder Datenquelle, strukturiert oder nicht, erfolgen. Dabei ist es unerheblich, ob diese lokal, in der Cloud oder auf entfernten Servern vorliegen.

Ein einfaches Anwendungsbeispiel mit U-SQL

Das klassische Beispiel für den Einsatz von U-SQL ist die Analyse des eigenen Twitter Netzwerkes. Hierbei wird herausgefunden, wie oft die Personen im eigenen Umkreis Tweets verfassen und in diesen erwähnt werden.

Das geschieht über eine CSV Datei, die sämtliche Tweets des eigenen Netzwerkes beinhaltet und auf dem Azure Data Lake Store gelagert wird. Das Ergebnis soll wiederum im CSV Format vorliegen und je zwei Einträge pro Person beinhalten, einen mit der Anzahl der Erwähnungen und einen mit den selbst verfassten Tweets.

Hier lässt sich die Integration von C# gut verwenden. Ein einzelner Tweet kann beispielsweise als C# String behandelt werden und anschließend über die Funktion Split in die einzelnen Worte zerlegt werden. Jedes mit einem @ beginnende Wort ist eine Erwähnung.

Weiterführende Artikel

Autor: Markus
2 Bewertungen 1 Stern2 Sterne3 Sterne4 Sterne5 Sterne
Loading...
0