Datenbank mal anders – eine BigQuery Starthilfe

BigQuery ist in aller Munde. Deshalb wollen wir euch nachfolgend mit den wichtigsten Infos ausstatten, um mit BigQuery loszulegen. Was ist es? Wie benutzt man es? Und vor allem wie teuer ist es und wer braucht es eigentlich? Hier findet ihr alle Infos, die ihr braucht.

Was ist BigQuery?

BigQuery ist eine cloudbasierte Datenbank aus dem Hause Google, in der man verschiedenste Datensätze speichern, verknüpfen, aufrufen und abfragen kann. Dabei ist die Datenbank aufgrund verschiedenster Logiken & Entwicklungen seitens Googles sehr performant – selbst größere Datenmengen können binnen Sekunden abgefragt und prozessiert werden. An dieser Stelle wollen wir uns jedoch nicht allzu sehr in technischen Details verlieren, sondern einem anderen großen Vorteil von Google BigQuery Tribut zollen. Denn jeder mit einem Google Account und etwas SQL Kenntnissen kann das Tool nutzen. Im Gegensatz zu anderen Datenbanken benötigt man keine Ressourcen, um das System zu verwalten oder die Rechenressourcen zu dimensionieren. Ganz im Gegenteil: Über bigquery.cloud.google.com kann BigQuery von jedem Ort mit einer Internetverbindung aufgerufen werden. Die Frage, wie das Tool von wem mit welcher Absicht bedient wird, liegt natürlich in unserer Hand – um alles andere kümmert sich Google.

Wie teuer ist es?

Den Vorteil der nicht nötigen Datenbankverwaltung und -skalierung lässt Google sich natürlich bezahlen. Hier halten sich die Kosten allerdings in Grenzen.

Um sich anfangs mit dem Tool auseinander setzen zu können, bietet Google einen Testaccount mit großzügigen Konditionen an. Mit einer Laufzeit von 12 Monaten und einem freien Budget von 300$ lassen sich einige Terabytes an Daten abfragen und speichern.

Zudem ist der Account nicht nur auf BigQuery limitiert, sondern umfasst auch andere Google Cloud Platform Produkte. Sollte dieser Freibetrag tatsächlich irgendwann aufgebraucht oder das Jahr vergangen sein, greifen folgende Preise:

  • Speicherung von Daten:
    • 0,02$ pro GB pro Monat (die ersten 10 GB im Monat sind kostenlos)
  • Abfragen von Daten:
    • 5$ pro 1 TB (das erste TB ist pro Monat kostenlos)

Dabei ist es wichtig zu wissen, dass das Tool nur erfolgreiche Abfragen berechnet. Sollte die Abfrage einen Fehler auswerfen, berechnet Google keinen Cent.

Alles in allem heißt das, dass sich die Kosten bei kleineren Datenmengen in einem überschaubaren Rahmen bewegen und keinesfalls im Verhältnis dazu stehen, was ausgegeben werden müsste, um die gleiche Qualität mit einer eigenen Datenbank zu bewerkstelligen. Für Firmen mit größerem Datenvolumen bietet Google zudem Pauschalpreise an.

Details zu den Preisen findest Du hier.

Hinzu kommt, dass es mehrere Sicherheitsmechanismen gibt, die ein Überschreiten des Budgets verhindern. Details dazu findest Du hier

 

Wie benutzt man es?

BigQuery enthält ein integriertes Abfragemodul, in dem die Abfragen direkt gestellt und die Daten entsprechend ausgegeben werden können.

Abfragen sind in SQL verfasst. In Bezug auf die SQL Nutzung innerhalb von BigQuery gibt es allerdings einen wichtigen Unterschied.

Es existiert sowohl der ältere “Legacy SQL” Dialekt, der eine Google spezifische Adaption des normalen SQL ist, als auch der im Juni 2016 eingeführte “Standard SQL” Dialekt.

Beide Dialekte sind aktiv und kann man verwenden. Bisher hat Google keine Anzeichen von sich gegeben, das teils sehr beliebte Legacy SQL abzuschaffen.

 

Wer braucht BigQuery? Und wofür?

Fälschlicherweise wird BigQuery oft nur im Zusammenhang mit Google Analytics gesehen.

Häufig wird es als eine Art Feature von Google Analytics 360 verstanden – damit tut man dem Tool allerdings unrecht.

BigQuery ist eine eigenständige Datenbank. Diese bringt durch die sehr einfach umzusetzende Verbindung zu Google Analytics einen großen Vorteil in der Analyse der Google Analytics Daten mit sich. Doch zusätzlich kann sie noch eine Menge weiterer Vorteile vorweisen.

Der Data Lake ist in aller Munde – BigQuery ist hier eine mögliche Alternative mehrere Datenquellen zusammenzuführen und sie zentral zu speichern.

Verschiedene Datensätze kann man entsprechend im Tool speichern und über einfache JOIN Abfragen miteinander verknüpfen. Wie man es von Google gewohnt ist, ist die Verknüpfung mit hauseigenen Programmen sehr einfach gestaltet – beispielsweise bietet es einen Data Transfer Service für AdWords, Ad Manager oder auch YouTube an.

Ein großer Vorteil ist zudem, dass Datensätze, die im Google Cloud Storage, in Cloud BigTable oder auch in Google Drive gespeichert wurden, abgefragt werden können. Ohne, dass diese dupliziert und als weiterer Datensatz innerhalb von BigQuery abgelegt werden müssen.  

Die Ergebnistabelle kann dann wiederum als Basis für ein Reporting dienen, das mehrere Datenquellen darstellt. Alle gängigen Visualisierungs-Tool verfügen mittlerweile über eine vordefinierte Schnittstelle zu BigQuery, über die die Daten kinderleicht und ohne Programmierkenntnisse ihren Weg in das entsprechende Tool finden.

 

Wer sollte BigQuery nutzen?

Alle, die möglichst heute noch in das Datenbankthema einsteigen, aber kein großes Budget in die Hand nehmen wollen, um eine eigene Datenbank aufzubauen, sind bei BigQuery richtig aufgehoben. Durch die einfache Bedienung lässt sich der Fokus auf die Abfrage, Verknüpfung und Analyse der Daten richten.

Vorteile bietet das Tool auch als zusätzliche Datenbank, um vorhandene Datenquellen wie zum Beispiel Google Analytics, Adwords & Co. zu verknüpfen oder mit anderen Daten aus dem Data Warehouse anzureichern. Durch den Vorteil, dass es – bis auf die sehr geringen Kosten der Speicherung – keine laufenden Kosten gibt, eignet sich das Tool sehr gut als Zweit-Datenbank.

 

Für alle Google Analytics 360 Nutzer bietet BigQuery außerdem den Vorteil, dass man Limitationen, die im Interface vorhanden sind, umgehen kann und man größere Mengen an Daten abfragen und verarbeiten kann.

Insgesamt hat Google mit BigQuery eine sehr gute Alternative zu anderen Datenbanken geschaffen. Dabei ist die Einstiegsschwelle sehr niedrig und die Kosten verhältnismäßig gering. Sowohl für Datenbankanfänger als auch für Fortgeschrittene bietet BigQuery das richtige Setup. Außerdem kann dies mit der Anbindung zu zahlreichen anderen Produkten ein Einstieg in die Welt der Google Cloud sein.

 

Die Fortsetzung von diesem Artikel findet ihr hier:

BigQuery – Eigenschaften und Fähigkeiten – Teil 2