Abonnez-vous Identifiez-vous

Identifiez-vous

Vos codes d'accès sont erronés, Veuillez les saisir à nouveau. Mot de passe oublié ?

Le Big Data s'invite sur les ordinateurs portables avec GraphChi

, , ,

Publié le

Les entreprises n'auront bientôt plus besoin de batteries de serveurs pour réaliser des analyses de gros volumes de données, ou Big Data. Un simple ordinateur portable pourrait suffire. C'est ce que promettent des scientifiques américains avec leur logiciel GraphChi.

Le Big Data s'invite sur les ordinateurs portables avec GraphChi © Patrick Hoesly - Flickr - C.C.

Des chercheurs de l'université Carnegie-Mellon assurent avoir développé un programme permettant de réaliser des analyses de gros volumes de données depuis un simple ordinateur portable. Baptisé GraphChi, ce logiciel exploite les larges capacités des disques durs équipant les derniers laptops afin de les transformer en plateforme de "Big Data".

Un petit rappel : le principe du Big Data est l'analyse de gros volumes de données, internes ou externes à l'entreprise, collectées dans une grande variété de formats. Cette technologie sert par exemple à réaliser une étude de marché concernant un produit, en analysant des millions de commentaires publiés sur les réseaux sociaux (analyse dite de "graph computing"). En général, le Big Data requiert d'énormes capacités de calcul et nécessite donc des batteries de serveurs.

Twitter analysé en moins d'une heure sur un Mac mini

Mais d'après les scientifiques de Carnegie-Mellon, un portable récent peut aussi faire du Big Data. "Les PC n'ont pas assez de RAM pour réaliser une analyse complète du Web (Web graph), mais ils disposent de disques durs, qui peuvent contenir beaucoup d'informations", explique Carlos Guestrin codirecteur du laboratoire de l'Université Carnegie Mellon où GraphChi a été développé. Il s'exprime en détail sur ce programme dans le journal Technology Review, publié par le Massachusetts Institute of Technology (MIT).

Selon Guestrin, un simple Mac mini fonctionnant avec GraphChi pourrait analyser tous les tweets postés sur Twitter depuis 2010 : en 59 minutes. Le même calcul prendrait : "400 minutes en utilisant un cluster classique d'environ 1000 ordinateurs", assure le chercheur. "Des outils comme GraphChi permettront à de nombreuses entreprises et start-up de répondre à tous leurs besoins en graph computing sur une seule machine. Cela est rentable, et stimule aussi l'innovation", conclut-il.

Le développement de GraphChi est réalisé à partir de Google Project Hosting, plateforme d'hébergement de projets open-source de Google .

Réagir à cet article

Créez votre compte L’Usine Connect

Fermer
L'Usine Connect

Votre entreprise dispose d’un contrat
L’Usine Connect qui vous permet d’accéder librement à tous les contenus de L’Usine Nouvelle depuis ce poste et depuis l’extérieur.

Pour activer votre abonnement vous devez créer un compte

Créer votre Compte
Suivez-nous Suivre Usine Nouvelle sur Facebook Suivre Usine Nouvelle sur Twitter RSS Usine Nouvelle