Le Big Data s'invite sur les ordinateurs portables avec GraphChi

Les entreprises n'auront bientôt plus besoin de batteries de serveurs pour réaliser des analyses de gros volumes de données, ou Big Data. Un simple ordinateur portable pourrait suffire. C'est ce que promettent des scientifiques américains avec leur logiciel GraphChi.

Partager

TESTEZ GRATUITEMENT L'ABONNEMENT À L'USINE NOUVELLE

15 jours gratuits et sans engagement

Le Big Data s'invite sur les ordinateurs portables avec GraphChi

Des chercheurs de l'université Carnegie-Mellon assurent avoir développé un programme permettant de réaliser des analyses de gros volumes de données depuis un simple ordinateur portable. Baptisé GraphChi, ce logiciel exploite les larges capacités des disques durs équipant les derniers laptops afin de les transformer en plateforme de "Big Data".

Un petit rappel : le principe du Big Data est l'analyse de gros volumes de données, internes ou externes à l'entreprise, collectées dans une grande variété de formats. Cette technologie sert par exemple à réaliser une étude de marché concernant un produit, en analysant des millions de commentaires publiés sur les réseaux sociaux (analyse dite de "graph computing"). En général, le Big Data requiert d'énormes capacités de calcul et nécessite donc des batteries de serveurs.

Twitter analysé en moins d'une heure sur un Mac mini

Mais d'après les scientifiques de Carnegie-Mellon, un portable récent peut aussi faire du Big Data. "Les PC n'ont pas assez de RAM pour réaliser une analyse complète du Web (Web graph), mais ils disposent de disques durs, qui peuvent contenir beaucoup d'informations", explique Carlos Guestrin codirecteur du laboratoire de l'Université Carnegie Mellon où GraphChi a été développé. Il s'exprime en détail sur ce programme dans le journal Technology Review, publié par le Massachusetts Institute of Technology (MIT).

Selon Guestrin, un simple Mac mini fonctionnant avec GraphChi pourrait analyser tous les tweets postés sur Twitter depuis 2010 : en 59 minutes. Le même calcul prendrait : "400 minutes en utilisant un cluster classique d'environ 1000 ordinateurs", assure le chercheur. "Des outils comme GraphChi permettront à de nombreuses entreprises et start-up de répondre à tous leurs besoins en graph computing sur une seule machine. Cela est rentable, et stimule aussi l'innovation", conclut-il.

Le développement de GraphChi est réalisé à partir de Google Project Hosting, plateforme d'hébergement de projets open-source de Google .

Partager

SUJETS ASSOCIÉS
NEWSLETTER Innovation
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Recevez directement leurs décryptages et analyses dans votre boîte mail:

Votre demande d’inscription a bien été prise en compte.

L'inscription aux newsletters vaut acceptation des Conditions Générales d'Utilisation. Lire la suite

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

Fermer
LES ÉVÉNEMENTS L'USINE NOUVELLE

LES SERVICES DE L'USINE NOUVELLE

ARTICLES LES PLUS LUS