L'heure est à l'optimisation des bases de données

Pour faire face à la croissance exponentielle des volumes d'informations à stocker, les entreprises consolident leurs bases et leurs entrepôts de données. Le mouvement est facilité par la performance accrue des équipements.

Partager

TESTEZ GRATUITEMENT L'ABONNEMENT À L'USINE NOUVELLE

15 jours gratuits et sans engagement

L'heure est à l'optimisation des bases de données

Une petite révolution est en cours sur le marché concurrentiel des bases de données. « Les nouveaux systèmes [de gestion de bases de données] vous incitent à oublier les schémas de partitionnement sur des disques, les stratégies d'indexation et la gestion de la mémoire tampon », écrivait début 2010 Carl Olofson, analyste chez IDC. Au contraire, « ils vous amènent vers un monde de très grandes bases, de processeurs dotés de multiples coeurs, de serveurs en grappes et de stockage dans des bases orientées colonnes, très compressées ». Dans les entreprises, , d'après ce consultant, les nouveaux systèmes sont déjà en phase de démocratisation. Dans quelques années, il y a fort à parier qu'ils auront partout remplacé les anciens.

Colonnes. Concrètement, alors que les bases de données sont jusqu'ici surtout partitionnées par lignes (pour faciliter la recherche de blocs de lignes, stockés dans des partitions indépendantes, par année...), elles devraient de plus en plus évoluer vers des systèmes répartissant les données dans des colonnes stockées directement dans la mémoire vive. Ce qui autorise, d'après lui, une plus grande vitesse de lecture et de compression des données. À horizon de cinq ans, les bases transactionnelles OLTP ( On Line Transaction Processing) pourront elles aussi traiter davantage de données en mémoire ( in-memory).

Déjà, certaines solutions de mise en réseau des bases de données (DB2 Purescale, MySQL Cluster...) permettent aux entreprises d'accélérer les performances de leurs bases de données transactionnelles en répartissant la charge sur plusieurs serveurs.

Entrepôts de données. Autre évolution : plusieurs spécialistes des systèmes de gestion de bases de données s'efforcent actuellement de localiser dans un même endroit les serveurs, les systèmes de stockage et les logiciels de bases de données. Ce type de solution, qui est surtout adapté à l'analyse de très gros volumes de données, permet d'accélérer les temps de transaction et de limiter les pertes de performance.

Cloud. Parallèlement, de nouvelles bases destinées au Web et au cloud computing sont en train de voir le jour à l'initiative d'acteurs comme Amazon (SimpleDB), Google (Fusion Tables) ou Microsoft (SQL Azure)... Optimisés pour la virtualisation et les applications en réseau, ces systèmes facilitent l'agrégation de données provenant de sources disparates.

Notons enfin l'émergence de nouvelles bases noSQL (Not Only SQL) dites « non relationnelles ». Initiées par des sites enregistrant un très grand nombre de contributions, comme Facebook, Twitter ou Foursquare, elles ne nécessitent pas d'interfaces SQL et facilitent le traitement en temps réel d'énormes volumes de données dans des environnements distribués. Le projet Cassandra, basculé en open source par Facebook en 2008, est probablement l'un des plus connus. Il en existe de nombreux autres, tels Hbase, MongoDB ou Voldemort. Et ce n'est certainement qu'un début.

Parts de marché des principaux éditeurs de bases de données relationnelles en 2008
Oracle 43,50%
IBM 21,70%
Microsoft 19,50%
Teradata 3,20%
Sybase* 3,00%
Progress Software 1,20%
Fujitsu 1,00%
SAS 0,50%
Netezza** 0,50%

Source: IDC (octobre 2009)


* Cet éditeur a été racheté par SAP en mai 2010.

** IBM a annoncé, en septembre 2010, le rachat de Netezza, spécialiste des entrepôts de données et des logiciels analytiques, pour 1,7 milliard de dollars.

Partager

SUJETS ASSOCIÉS
NEWSLETTER Innovation
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Recevez directement leurs décryptages et analyses dans votre boîte mail:

Votre demande d’inscription a bien été prise en compte.

L'inscription aux newsletters vaut acceptation des Conditions Générales d'Utilisation. Lire la suite

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

Fermer
LES ÉVÉNEMENTS L'USINE NOUVELLE

LES SERVICES DE L'USINE NOUVELLE

ARTICLES LES PLUS LUS