L'heure est à l'optimisation des bases de données
Publié le
articles liés
Où sont vos données ? Big Data fait parler vos données Les besoins en capacités de stockage s'envolentPour faire face à la croissance exponentielle des volumes d'informations à stocker, les entreprises consolident leurs bases et leurs entrepôts de données. Le mouvement est facilité par la performance accrue des équipements.
Une petite révolution est en cours sur le marché concurrentiel des bases de données. « Les nouveaux systèmes [de gestion de bases de données] vous incitent à oublier les schémas de partitionnement sur des disques, les stratégies d'indexation et la gestion de la mémoire tampon », écrivait début 2010 Carl Olofson, analyste chez IDC. Au contraire, « ils vous amènent vers un monde de très grandes bases, de processeurs dotés de multiples coeurs, de serveurs en grappes et de stockage dans des bases orientées colonnes, très compressées ». Dans les entreprises, , d'après ce consultant, les nouveaux systèmes sont déjà en phase de démocratisation. Dans quelques années, il y a fort à parier qu'ils auront partout remplacé les anciens.
Colonnes. Concrètement, alors que les bases de données sont jusqu'ici surtout partitionnées par lignes (pour faciliter la recherche de blocs de lignes, stockés dans des partitions indépendantes, par année...), elles devraient de plus en plus évoluer vers des systèmes répartissant les données dans des colonnes stockées directement dans la mémoire vive. Ce qui autorise, d'après lui, une plus grande vitesse de lecture et de compression des données. À horizon de cinq ans, les bases transactionnelles OLTP ( On Line Transaction Processing) pourront elles aussi traiter davantage de données en mémoire ( in-memory).
Déjà, certaines solutions de mise en réseau des bases de données (DB2 Purescale, MySQL Cluster...) permettent aux entreprises d'accélérer les performances de leurs bases de données transactionnelles en répartissant la charge sur plusieurs serveurs.
Entrepôts de données. Autre évolution : plusieurs spécialistes des systèmes de gestion de bases de données s'efforcent actuellement de localiser dans un même endroit les serveurs, les systèmes de stockage et les logiciels de bases de données. Ce type de solution, qui est surtout adapté à l'analyse de très gros volumes de données, permet d'accélérer les temps de transaction et de limiter les pertes de performance.
Cloud. Parallèlement, de nouvelles bases destinées au Web et au cloud computing sont en train de voir le jour à l'initiative d'acteurs comme Amazon (SimpleDB), Google (Fusion Tables) ou Microsoft (SQL Azure)... Optimisés pour la virtualisation et les applications en réseau, ces systèmes facilitent l'agrégation de données provenant de sources disparates.
Notons enfin l'émergence de nouvelles bases noSQL (Not Only SQL) dites « non relationnelles ». Initiées par des sites enregistrant un très grand nombre de contributions, comme Facebook, Twitter ou Foursquare, elles ne nécessitent pas d'interfaces SQL et facilitent le traitement en temps réel d'énormes volumes de données dans des environnements distribués. Le projet Cassandra, basculé en open source par Facebook en 2008, est probablement l'un des plus connus. Il en existe de nombreux autres, tels Hbase, MongoDB ou Voldemort. Et ce n'est certainement qu'un début.
| Oracle | 43,50% |
| IBM | 21,70% |
| Microsoft | 19,50% |
| Teradata | 3,20% |
| Sybase* | 3,00% |
| Progress Software | 1,20% |
| Fujitsu | 1,00% |
| SAS | 0,50% |
| Netezza** | 0,50% |
Source: IDC (octobre 2009)
* Cet éditeur a été racheté par SAP en mai 2010.
** IBM a annoncé, en septembre 2010, le rachat de Netezza, spécialiste des entrepôts de données et des logiciels analytiques, pour 1,7 milliard de dollars.

dans la même rubrique
26/05/2012 La sémantique de l'industrie26/05/2012 L'impression 3D détournée par l'artiste Neri Oxman
26/05/2012 "Je suis fasciné par les technologies sans fil"












