BigQuery : le data warehouse cloud de Google

Google BigQuery est un entrepôt de données dans le cloud, hautement scalable, distribué et en mode sans serveur (serverless).

BigQuery, c'est quoi ?

Lancé en 2012, Google BigQuery est un service cloud d'entrepôt de données d'entreprise distribué, hautement scalable et sans serveur (serverless). Nativement pensée pour le big data, cette plateforme permet d'analyser de très grands volumes de données à l'échelle du pétaoctet (Po). Google BigQuery permet d’effectuer des requêtes SQL sur des données structurées aux formats JISON, CSV ou Avro.

BigQuery est SQL ou NoSQL ?

A la différence de Bigtable, service de base de données NoSQL, BigQuery a une approche relationnelle. Les données stockées dans des tables structurées, avec des colonnes et des lignes, que l'on interroge avec le langage SQL. Son approche big data distingue la plateforme des SGBDR traditionnels. Basé sur Dremel, le moteur de requête de Google, elle peut analyser des pétaoctets de données en quelques secondes.

Pourquoi utiliser BigQuery ?

Au-delà de sa scalabilité virtuellement infinie, BigQuery présente l'avantage d'être serverless. L'utilisateur n'a pas besoin de provisionner des instances ou des machines virtuelles (VMs), la plateforme alloue automatiquement les ressources dont il a besoin. Avec BigQuery Omni, elle aussi une dimension multicloud. L’interface de BigQuery peut interroger des données qui se trouvent sur les clouds de Microsoft Azure et d'AWS sans avoir à les déplacer ou à les copier.

Comment utiliser BigQuery

BigQuery étant un service est entièrement géré, il suffit de transférer les données dans le cloud pour profiter de l'infrastructure de Google. Il est possible d'interagir avec la plateforme en appelant son API REST ou une interface en ligne de commande. BigQuery repose sur deux briques principales : le moteur de requête Dremel et le système de gestion de clusters à grande échelle le Borg.

Quel est le prix de BigQuery ?

Le service est gratuit jusqu'à 1 To de données de requêtes traitées chaque mois. Ensuite, Google facture des coûts de stockage des données chargées dans BigQuery et des coûts pour l'analyse de ces données (traitement des requêtes).