Billet d'humeur
"Fighting for peace is like screwing for virginity" dixit mon briquet qui me tient de George Carlin.
 
Menu principal
Accueil
Actualités
Liens
Définitions de l'I.E.
IE Map
Moteur IE
Personnalités
Téléchargements
Formations IE
MS IE ESC Toulouse
MS IECS ICOMTEC
MS IE UT1
Archive
Connexion





Mot de passe oublié ?
Pas encore de compte ? Enregistrez-vous
ActuBlogLog
Mon Flickr
www.flickr.com
Twitter cdfr31
    Criteo
    Partenaires


    En partenariat avec amazon.fr


    Intelligence économique, veille et recherche d'informations - Actulligence.com
    Le web invisible ou le web profond c'est quoi?
    Écrit par Frédéric Martinet   
    16-11-2008

    Digimind a publié début novembre un très court PDF [inscription obligatoire] avec 4 images afin d'expliciter ce qu'est le web invisible.

    Digimind précise que la définition première est : tous les documents non indexés ou partiellement indexés par les moteurs de recherche.

    Cela recouvre donc :

    • les pages sécurisées
    • les documents trop volumineux
    • les pages orphelines
    • les pages générées dynamiquement
    • les formats mal reconnus

    Les pages sécurisées comprennent toutes les bases de données professionnelles, les sites nécessitant un login / password, un abonnement, et les profils de réseaux sociaux type Facebook accessibles uniquement lorsque vous disposez d'un compte et / ou que vous êtes coopté.

    Elles comprennent aussi les pages pour lesquelles le webmaster utilise le fichier robots.txt ou bien encore les commandes de type "no follow".

    Les document trop volumineux sont principalement des documents types bureautiques dont la taille en Mo dépasse un certain volume et Google (et les autres moteurs n'indexent donc que partiellement le contenu afin de ne pas surcharger leur index.)

    Les pages orphelines sont des pages vers lesquelles aucune autre page accessible par les moteurs de recherche ne fait de lien.

    Les pages générées dynamiquement ne sont pas à proprement parler non indexées par les moteurs de recherche (Google en tête). En effet aujourd'hui, ce qu'on appelle pages dynamiques est généralement indexé par Google. En effet tous les CMS, blogs et autres sont ce qu'on appelle dynamiques, c'est à dire que la page résultante est générée et interprétée à la volée et qu'elle n'est pas un fichier statique. Mais toutefois, certaines pages dynamiques ne sont pas accessibles facilement via les moteurs de recherche. En effet, historiquement, Google n'aime pas particulièrement les URL à rallonge comportant un nombre important de paramètres (ce qui suit un point d'interrogation dans une URL) et par ailleurs, les pages résultant d'un formulaire de requête en POST (formulaires d'interrogation de bases de données par exemple).

    De plus, les formats de fichiers ne sont pas encore indexés par les moteurs de recherche qui se partagent le marché du search online...même si ces derniers se font de plus en plus rare...

    On peut ensuite rajouter à ce web invisible tous les fichiers que les moteurs de recherche blacklistent pour cause de non respect de leurs règles : duplicate content (plusieurs fois le même contenu ou presque derrière plusieurs URL), de cloaking (renvoyer une version différente de page à un moteur de recherche et à un internaute), ou de spamdexing (multiplication de mots clés cachés de façon à berner les moteurs de recherche).

    Le web invisible comporte aussi des barrières plus locales : en effet certains sites ne sont accessibles que si vous vous connectez d'un certain pays. Typiquement Google vous renvoie des résultats différents selon l'endroit d'où vous vous connectez.... Exemple aussi, certains sites gouvernementaux américains ne sont accessibles que si vous vous connectez d'un proxy en sol américain.

    Côté multimédia, et bien que cela progresse, les vidéos et images sont accessibles mais souvent par rapport au contenu textuel qui les entourent. On a donc un web invisible partiel sur ce type de documents puisque c'est l'environnement qui en est indexé et non pas le contenu audio et vidéo. A noter, Google risque de réduire le web profond sur la partie images étant donné qu'il va se mettre à océriser les images et pdf ne disposant pas d'une couche texte.

    De même les contenus émanant de technologies propriétaires ou exotiques (javascript de liens complexes, contenu AJAX, mais aussi contenu Flash - quoique..)

    Enfin, le web invisible ou web profond, pour résumer on ne sait pas tout ce que c'est puisque par définition le contenu est difficilement accessible et que par ailleurs les moteurs de recherche n'ont pas forcément tendance à communiquer sur ce qu'ils n'inexent pas. Je me permets aussi de rester sceptique sur toute évaluation de taille du web visible et invisible... Déjà la taille du web visible n'est pas simple à estimer....alors du web invisible...je ne suis pas Madame Irma.



    Ecrire un commentaire
    Dernière mise à jour : ( 18-11-2008 )
     
    Lazy Sheep vous aide à bookmarker sur Del.icio.us
    Écrit par Frédéric Martinet   
    16-11-2008
    Tous ceux qui s'intéressent au web 2.0 connaissent Del.icio.us, l'Application avec un grand A de social bookmarking. Et je pense que tous ceux qui l'utilisent régulièrement se sont dits : Del.icio.us, c'est vraiment intéressant, mais alors qu'est-ce que c'est pénible de tagger ses bookmarks et de saisir les descriptions. En tout cas, moi, je me le suis dit... et d'ailleurs j'utilise du coup très peu mon del.icio.us, un peu déprimé devant l'ampleur de la tâche visant à réorganiser tout mon bookmark.

    Voilà peut-êter la solution pour tous ceux qui veulent utiliser Del.icio.us et éviter de perdre trop de temps à mettre en ligne ses favoris.

    Lazy Sheep.

    Lazy Sheep est un bookmarklet (petite ligne de code jaavscript que vous pouvez ajouter comme favoris dans votre barre de liens rapide pour exécuter de petites fonctionnalités) qui permet de récupérer automatiquement les tags proposés par d'autres utilisateurs de Del.icio.us pour une URL, ainsi, éventuellement, qu'une description.

    A utiliser sans modération donc pour tous les adeptes du Web 2.

    Ecrire un commentaire
    Dernière mise à jour : ( 16-11-2008 )
     
    Synthesio lance son service de veille image
    Écrit par Frédéric Martinet   
    09-11-2008

    Synthesio, qui est une société que je suis avec le plus grand intérêt depuis ses débuts, a annoncé à l'occasion du SEMO 2008, le lancement d'une nouvelle offre dans la tendance "brand monitoring" / veille image : Consumer.

    Il faut dire que désormais, Synthesio compte pas moins de 100 000 sources webs à travers 130 pays, toutes qualifiées, indexées et intégrées aux crawls quotidiens de Synthesio, ce qui en fait un des plus beaux échantillons web que je connaisse pour une société française.

    Le produit Consumer est donc un outil permettant d'identifier les rumeurs et les tendances et les influenceurs qui se cachent derrière.

    Consumer propose des vues reportings orientées décisionnel : très claires et relativement synthétiques.

    Un nouveau venu dans le monde du reporting en quasi temps-réel sur des prestations de veille image.

    Par ailleurs Synthesio met en avant dans son nouveau site son offre spécialisée en veille sponsoring sportif, SportTrackTM. Lancé en partenariat avec TNS Sport, cet outil permet aux directions communication de jauger la visibilité offert par les différents sponsorings sportifs dans lesquels elles investissent.

    Aller plus loin :



    Ecrire un commentaire
    Dernière mise à jour : ( 16-11-2008 )
     
    4ème édition Que sais-je Intelligence Economique et autres
    Écrit par Frédéric Martinet   
    20-10-2008

    Peu de billets en ce moment mais c'est tout simplement que mon activité ne se déroule pas que sur le web...

    Alors pour faire un petit tour d'horizon de ce qui se passe In Real Life pour moi.

    Tout d'abord sachez qu'est sorti en août 2008 une quatrième édition du Que sais-je? de Daniel Rouach, entre autre professeur à l'ESCP-Eap, "La veille technologique et l'intelligence économique" aux éditions Presses Universitaires de France. Et si j'en parle c'est aussi et surtout parceque j'ai eu le plaisir d'y participer sous la bannière KB Crawl en y signant un court passage sur les logiciels et les plateformes de veille.

    En dehors de l'écriture et des articles que j'aurais dû rendre il y a fort longtemps -mea culpa Jacqueline - je me complais dans le rôle de conférencier sur des thématiques aussi diverses et variées que "Identité Numérique et e-reputation" et le fort improbable mais tout aussi palpitant "Intelligence Economique et Développement Durable" où j'ai partagé le plateau avec Monsieur Besson.

    Et pour preuve, le support imparfait que j'avais promis de diffuser à Tarik et à Arnaud. Imparfait car bien évidemment le support n'est par définition qu'un support à mon ramage ... la preuve dans une vidéo déformée, au son approximatif et à la qualité douteuse, filmée à l'insu de mon plein gré.

    Dernier hobby enfin (sous la torture et la menace de mes collègues et anciens amis), je me suis aussi essayé au septième art dans un étrange remake de Star Wars. (Je préférais diffuser moi même cette vidéo avant que son contrôle ne m'échappe!)



    Ecrire un commentaire (1)
    Dernière mise à jour : ( 20-10-2008 )
     
    Adiesa, association intelligence économique en région Centre
    Écrit par Frédéric Martinet   
    20-10-2008
    Scip, Afdie, Fepie, ...

    Que de noms ré-sonnent (le glas) dans mes oreilles lorsque l'on en vient à parler d'association faisant la promotion de la discipline ou des métiers de l'intelligence économique.

    Mais aujourd'hui par le heureux hasard d'un lecteur RSS cumulé avec une sérendipité débordante, ne voilà-t'il pas que le flux Twitter de Bruno Jacquemin, grand gourou du web 2.0 orléanais et illustre DG de la CCI du Loiret ne me conduit pas vers le portail Netvibes que la dite CCI vient de mettre en ligne et vers cette association jusque là inconnue de moi (et peut être de nombreux autres...), l'Adiesa, Association pour le développement de l’intelligence économique et stratégique appliquée (en région Centre)...

    Bref, si vous êtes une entreprise de la région centre, que l'intelligence économique vous intéresse, ou bien que vous êtes consultant dans ce métier, pourquoi ne pas devenir adhérent de l'Adiesa.

    En plus l'association vient de lancer un blog hyper riche en contenus. A réserver à ceux qui n'ont pas peur de lire des billets fleuves!

    Trêve de plaisanteries, la promotion de l'Intelligence Economique en région est une bonne chose. Parcequ'il n'y a pas qu'à Paris que l'on peut faire de l'Intelligence Economique.

    Ecrire un commentaire (1)
    Dernière mise à jour : ( 20-10-2008 )
     
    Conférence "Gérer son identité numérique"
    Écrit par Frédéric Martinet   
    30-09-2008

    En dehors de mon travail, d'une rentrée agitée et des cours de fac pour lesquels je suis passé de l'autre côté du bureau, une autre des raisons pour lesquelles je publie trop peu de billets en ce moment :

    "Titre : Conférence "Gérer son identité numérique"

    L'Infothèque du Pôle Universitaire Léonard de Vinci organise le 2 octobre prochain une conférence-débat sur le thème "Gérer son identité numérique".

    En navigant sur le web, en participant à des réseaux sociaux amicaux ou professionnels, en contribuant à des blogs ou à des sites communautaires, ou tout simplement en effectuant des achats en ligne, les internautes que nous sommes laissons des traces sur les sites et les moteurs de recherche.
    Le concept d'identité numérique recouvre l'ensemble de ces données personnelles, qu'elles soient sous forme textuelle ou multimédia, photo ou vidéo.

    Comment gérer son identité numérique, comment mettre en place une stratégie efficace de « marketing de soi » sur le web ? Comment tirer parti au mieux des nouveaux outils et services associés ? Comment protéger sa vie privée, se prémunir contre des usurpations d'identité ?

    Cette conférence, animée par Frédéric Martinet, consultant veille chez KB Crawl et webmaster du site Actulligence, permettra de faire le point sur la question, à partir d'exemples concrets.

    La conférence aura lieu le jeudi 2 octobre de 9h30 à 11h30, au Pôle Universitaire Léonard de Vinci (Paris La Défense). Le nombre de places étant limité, merci de vous inscrire au plus vite sur notre site : www.devinci.fr/info
    Retrouvez également l'"identité numérique" de l'Infothèque sur Facebook.

    ---

    Et retrouvez aussi quelques éléments de mon identité numérique sur :

    Actulligence | Facebook | Viadeo | Linkedin | ClaimID | Ziki | etc... (Attention, certains à jour et d'autres moins...C'est que gérer son identité numérique cest un job à part entière mon bon monsieur!)



    Ecrire un commentaire (4)
    Dernière mise à jour : ( 30-09-2008 )
     
    << Début < Précédente 1 2 3 4 5 6 7 8 Suivante > Fin >>

    Résultats 1 - 9 sur 69
    Qui suis-je ?
    Frédéric Martinet

    Consultant et formateur veille et intelligence économique
    Webmaster d'un site sur l'intelligence économique depuis 8 ans (martinet-on-line.com désormais devenu actulligence.com)
    Intervenant dans plusieurs formations de 3ème cycle en veille et intelligence économique.

    Consultez mon CV :
    - Français HTML
    - Français Word
    - English Word


    Add me on MSN frederic.martinet on Google Talk


    Frédéric Martinet

    Frederic Martinet


    International Actulligence
    Actulligence via RSS

    Subscribe in Rojo
    Add to netvibes
    Subscribe in Bloglines

    Subscribe in NewsGator Online
    Ajouter ce flux à votre Protopage
    Add to Google

    Abonnement email

    Vous êtes allergique au RSS? Abonnez vous par mail!

    Blogs préférés
    Mais aussi :
    RSS Mix
    Autopromo
    © 2008 Intelligence Economique, veille, recherche d informations
    Joomla! est un logiciel libre distribué sous licence GNU/GPL. URL rewriting by Artio JoomSEF. URL rewriting by Artio, sponsored by Traveliana.


    Internet Map