Apache Parquet
Apache Parquet ist ein spaltenorientiertes Dateiformat (Columnar Storage), das speziell für die effiziente Speicherung und Verarbeitung großer Datenmengen entwickelt wurde. Es wird häufig im Umfeld …
WeiterlesenApache Parquet ist ein spaltenorientiertes Dateiformat (Columnar Storage), das speziell für die effiziente Speicherung und Verarbeitung großer Datenmengen entwickelt wurde. Es wird häufig im Umfeld …
WeiterlesenApplication Programming Interface (API) Der Begriff API steht für Application Programming Interface, auch bekannt als Programmierschnittstelle. Eine Programmierschnittstelle wird genutzt, um Drittprogramme mit dem Hauptprogramm …
WeiterlesenApache Pig Apache Pig wurde 2006 von Yahoo entwickelt und ist heute ein Apache Open Source-Projekt sowie Bestandteil des Hadoop Ökosystems. Anlass der Entwicklung waren …
WeiterlesenApache Hive Apache Hive ist eine Open Source Lösung zur Erstellung von ETL Prozessen und Data Warehouse Lösungen, die auf Hadoop aufsetzt. Hive gehört zu …
WeiterlesenA/B-Testing Das A/B-Testing, auch Split Testing genannt, ist eine randomisierte Testmethode, um zwei Varianten desselben Systems oder Produkts zu vergleichen. Meistens handelt es sich dabei …
Weiterlesen