C'est un fait : au fil du temps, les contenus accessibles via des ressources intranet explosent dans l'entreprise, entre les contenus publies par le canal officiel de l'intranet et tous les autres, publiés par les structures de l'entreprise. Comme plus personne ne sait gérer cette masse d'information, on rêve à un moteur de recherche d'entreprise.

 

Digital interne

Le moteur de recherche

 

Le moteur de recherche de l'entreprise, c'est un peu le Saint Graal que toutes les grandes sociétés recherchent. 

 

L'infobésité

 

On appelle "infobésité" cette surabondance d'informations et de contenus. Cette "surcharge" informationnelle peut tuer l'efficacité au sein de l'entreprise, car tout n'est pas bon dans ce volume d'information.  

 

Certaines informations sont pertinentes, dont ne le sont pas. Certains infos sont fiables, d'autres ne sont que des documents de travail non aboutis. Certaines informations ou certains documents sont toujours d'actualité, d'autres sont périmés depuis très longtemps. Les seuls qui connaissent la valeur de ces documents, ce sont leurs rédacteurs.

 

Toute la "bonne information" constitue cependant le patrimoine de l'entreprise. Au delà de l'importance de bien la conserver (c'est un autre sujet, et même un autre métier et d'autres outils), les entreprises se demandent très vite comment permettre à ses collaborateurs de pouvoir facilement rechercher la bonne information en quelques clics. Logiquement, la question du moteur de recherche se pose donc très vite aux entreprises qui constatent monter la quantité d'information.

 

Le besoin en matière de moteur de recherche diffère cependant selon l'activité de l'entreprise. Les sociétés du BTP par exemple auront des besoins plus impérieux en matière de gestion de plans, tandis que d'autres gèreront plutôt des documents. La réponse a apporter selon les cas n'est pas toujours la même.

 

Le rêve du moteur global

 

Comme personne ne saurait dire où se trouvent les informations et les documents, la tentation est de se dire qu'il doit bien exister quelque part un outil informatique qui pourrait gommer cette anarchie, et permettre, par la recherche, de retrouver les accès à cette masse d'information inaccessible.

 

Le sujet du moteur de recherche global d'entreprise est donc souvent abordé sous cet angle, celui d'un rêve d'un MagicWare qui réorganiserait tout seul les accès vers les bons documents (comme Google, vous dira-t-on).

 

Le besoin

Rechercher quoi ?

 

Très souvent, le réflexe des maîtrises d'ouvrage qui décident qu'un moteur de recherche s'impose, c'est de se tourner vers leurs équipes informatiques avec une demande qui tient en une ligne : - mettez nous en place un moteur de recherche

 

Si la Maîtrise d'oeuvre connaît un peu son métier, elle répondra :

- pour chercher où ?

 

Et comme la maîtrise d'ouvrage est incapable de répondre, elle dira :

- pour chercher partout

 

Hélas, ce n'est pas si simple, car le champ de recherche est, très très large (lire ce billet, et cet extrait du livre):

 

  • On pense d'abord aux documents des différentes GED. Il peut y en avoir des centaines de milliers, voir bien plus. Mais ce n'est pas suffisant comme description : quelles sont les sources concernées ? est ce que ce sont tous les documents des serveurs de fichiers, ou seulement ceux des sites SharePoint ou des outils estampillés "GED"?
     

  • Ca peut être aussi les données de certains applications : dans ce cas, il faut étudier précisément  les données concernées, et la manière de présenter ces informations
     

  • Ça peut être des vidéos si votre entreprise dispose d'une plateforme de diffusion
     

  • Ça peut être aussi des sites web, internes ou externe : la recherche pourrait donner le lien vers les pages d'accueil de ces sites internet ou intranet

  •  ...

 

Les combinaisons sont multiples et bien définir au sein métier et fonctionnel ce qu'on attend du moteur est essentiel pour passer à l'étape suivante qui est la recherche du moteur. Cette phase de réflexion, c'est la maîtrise d'ouvrage qui doit l'avoir (avec l'aide de sa maîtrise d'oeuvre si besoinà, en impliquant les responsables des sources des données à indexer.

 

Pour bien comprendre les problématiques, je vous invite à lire ce billet posté précisément sur ce sujet : cliquer ici

 

 

Les principes

Les offres de moteur de recherche sont nombreuses. Mon objectif n'est pas d'en faire une liste exhaustive qui sera déjà fausse demain. Mais on peut décrire certains grands modes de fonctionnement.

 

La recherche Plain texte

 

Certains moteurs (les plus classiques) fonctionnent par des recherches "plain texte" dans le contenu du document des mots clés saisis par l'utilisateur. C'est une recherche "bête" par recherche de mots dans des contenus.

 

Les moteurs proposent souvent de base quelques ajustements automatiques intelligents (par exemple en recherchant les singuliers / pluriels des mots, en ne tenant pas compte des majuscules / accents, en conjuguant des verbes).

 

Reste que dans ce mode de recherche, vous êtes sujets à pas mal de pollution, puisque les mêmes mots clés (des mots courant) peuvent se retrouver dans nombre de documents.

 

On peut orienter la recherche en associant aux contenu des propriétés (tags) associés aux documents (dans des outils de GED uniquement - sur les serveurs de fichiers, c'est mort) qui seront indexés par le moteur, avec un "poids" de pertinence plus élevé : on part du principe que si l'auteur du doc a pris la peine de mettre ce mot clé dans les "propriétés" du document, c'est que c'est particulièrement pertinent.

La recherche sémantique

 

Il y a également des moteurs beaucoup plus sophistiqués qui sont capables de faire une recherche sur la base de contexte.

 

Par l'analyse des mots présents dans les textes, ces moteurs peuvent identifier un "contexte" associé à chaque document mais aussi à votre recherche. En retour, vous aurez la liste des documents dont les contextes correspondent.

 

Par exemple, si je recherche "Barack Obama", le moteur comprendra que c'est le président des USA, et il me proposera en retour des contenus en rapport avec la présidence des USA : il me proposera également différents contextes d'annexe que je pourrai sélectionner pour affiner ma recherche. Exemple : USA, présidents, gouvernement, politique américaine, ...

 

Ce type de moteur nécessite toutefois d'être un minimum managé. Il y un dictionnaire à gérer et à tenir à jour pour permettre au moteur de pouvoir associer mots et contextes. Par exemple, si vous avez une application informatique en interne qui s'appelle "ADN", il ne faut pas que le moteur vous renvoie des infos sur l'acide désoxyribonucléique.

 

J'ai vu plusieurs démonstrations de moteurs de recherche. A chaque fois, la démonstration reposait sur une bibliothèque de documents de type "articles d'actualités". Jamais sur des spécifications techniques de projets. Or dans de tels documents, les mots sont bien souvent toujours les mêmes ; seul le sens change en fonction du projet. Dans un tel cas de figure les moteurs de recherche sémantiques ont certainement plus de difficulté (pour tout contre exemple, me contacter !).

 

Partant du principe que n'importe quel utilisateur devrait pouvoir trouver n'importe quelle information ou document au sein de l'intranet comme il peut le faire sur le net via son Google préféré, beaucoup d'entreprises cherchent à déployer un moteur "globale" d'entreprise, permettant de chercher partout des informations répondant à une recherche par mot clé des collaborateurs.

 

Sur le plan technique, il existe des moteurs très puissants permettant d'indexer si vous le souhaitez toutes les sources d'information de l'entreprise. Une fois le moteur acheté et installé, faire les différentes connexions du moteur avec les différentes sources pour en "digérer" le contenu (indexer) n'est pas une vaste affaire. J'aurais même tendance à dire que c'est finalement plutôt simple.

 

Mais selon moi, la difficulté est ailleurs. J'en vois principalement trois et elles n'ont rien de technique.

 

1. savoir identifier les sources

 

La première difficulté, c'est d'identifier les sources d'information à "plugger" sur le moteur. C'est difficile car pour identifier ce qui est utile aux collaborateurs, il faut savoir ce qui existe, et ce que chaque source contient.

 

Dans de grandes entreprises où les structures sont autonomes, il n'existe souvent pas de cartographie. Et résoudre la difficulté en décidant "bon, comme on se sait pas ce qui existe, on va simplifier en indexant tout, pour ne pas se poser la question de ce qui est pertinent", n'est pas une solution : pour brancher les tuyaux sur le "tout", il faut savoir au minimum ou ça se trouve et ce que c'est comme technologie, CQFD.

 

Par exemple, faut il indexer (tous) les serveurs de fichiers de l'entreprise ou seulement certains ? Est-ce que ce sont toutes les ressources SharePoint par exemple ? Est-ce que ce sont des liens vers des sites (et pas forcément leur contenu interne - plutôt des liens vers les home pages) ?

 

Faut-il aussi indexer les applications qui fournissent de l'information, mais pas sous forme de documents bureautiques ? Si oui, lesquelles et disposent-elles de "connecteurs" pour permettre au moteur d'indexer les contenus et d'afficher efficacement les résultats ?

 

Bref, cette seule définition du périmètre dans une grande entreprise est déjà un travail en soi assez phénoménal, d'autant plus difficile si l'anarchie y règne au niveau de l'intranet. Et ce n'est clairement pas un travail d'informaticien, mais plutôt celui d'un documentaliste sous la houlette de la maîtrise d'ouvrage. En d'autres mots, votre MOE attend vos inputs pour brancher les tuyaux.

Les difficultés

2. autoriser les indexations

 

La seconde difficulté, c'est de s'assurer que les responsables de ces sources d'informations autorisent l'indexation de leurs contenus.

 

Les "éditeurs" des informations que le moteur de recherche permettra de rechercher sont en premier lieu concernés par la mise en place d'un moteur de recherche. Ce n'est pas forcément au niveau du choix technique ou fonctionnel, mais plus certainement sur leur volonté, ou capacité à ce que les informations dont ils sont responsables puissent "remonter" via un moteur de recherche.

 

Il y a plusieurs raisons qui peuvent faire qu'un éditeur de contenus (responsables d'une GED ou autre) ne souhaite pas que les infos dont il a la charge soient accessibles via un moteur de recherche plus global : les données sont peut être confidentielles, ou leur "GED" n'est plus à jour (on l'a gardé pour mémoire), ou ces documents ne vont intéresser personne (risque inutile de pollution), etc.

 

Pour cela, la tâche est ardue : comme je l'ai dit, il n'y a que très rarement une "cartographie" générale des sources de contenus, et donc pas de contacts connus pour chacune de ces sources pour les informer ou les impliquer.

 

Maintenant, imaginons que vous ne preniez pas la peine d'informer ces responsables, et que de votre propre initiative vous pluggiez leurs sources de contenu sur votre moteur magique : que pourrait-il se passer ?

 

Et bien du jour au lendemain, leurs documents cachés au fin fond de leurs serveurs documentaires vont être accessibles facilement par toute personne faisant une recherche. Problème : ont-ils pu vérifier qu'ils avaient positionné les bons droits d'accès sur tous les répertoires ? Car toutes les recherches du mot "confidentiel" feront remonter sans état d'âme les documents ainsi estampillés mais mal protégés. Jusque-là leur seule sécurité c'est qu'ils étaient difficilement accessibles.

 

3. gérer le moteur

 

La troisième grande difficulté c'est de gérer la vie d'un tel moteur de recherche. Une gouvernance d'un moteur global me paraît indispensable surtout si le moteur est présenté comme un outil métier .

 

Il faut par exemple vérifier la pertinence des sources indexées, identifier celles qui ne sont plus à jour, et les nouvelles qu'il faudrait ajouter au périmètre. Il faut également générer le paramétrage du moteur, qui permet par exemple de mettre en meilleure visibilité les contenus les plus pertinents.

 

Pour les moteurs sémantiques c'est aussi la gestion du Dictionnaire utilisé par le moteur. C'est donc un documentaliste qu'il faut embaucher, en relation avec tous les responsables des sources de contenus.

 
 

La vision classique que l'on a du moteur de recherche global d'entreprise est un moteur qui recherche des documents (et surtout des documents) partout dans l'entreprise et qui vous en donne une liste à la Prévert, avec si possible les documents les plus pertinents.

 

Cette vision me semble complètement obsolète.

 

Stop au document-centrique

 

Encore aujourd'hui, les entreprises pensent à tord que l'information que partagent les collaborateurs au sein d'une entreprise, ce sont uniquement des documents (Word, Powerpoint, Excel, ...).

 

En réalité, "l'information" revêt bien d'autres formes : des formes "structurées" (comme les listes SharePoint), des blogs, wiki, et autres pages Web. Il y aussi des informations dans les réseaux sociaux d'entreprise (documents, notes, profils utilisateurs, etc). 

 

Surtout, en dehors de son contexte, le "document" a peu de crédibilité

 

Par exemple, si mon moteur retrouve un fichier stocké sur un vieux serveur de fichiers paumé, qui me dit qu'il est toujours valable ? Par contre, si je trouve un fichier "budget projet Tucson" sur la communauté de travail du projet Tucson, j'ai toutes les raisons de penser que je suis sur le bon fichier.

 

Les nouveaux enjeux

Trouver les bonnes sources

 

Ma vision des choses, c'est que la recherche de documents partout dans l'entreprise n'est plus la cible.

 

Le vrai enjeu, c'est de savoir rediriger l'utilisateur vers les bonnes sources de contenu, et vers les services / outils dont il a besoin.

 

Retrouver les bonnes sources de contenu, c'est offrir à l'utilisateur en guise de réponse à une recherche, non pas 10 000 documents en résultats mais plusieurs liens vers des sources (sites GED ou collaboratifs) qui traitent le sujet qui correspond à la recherche, ou vers les communautés RSE qui traitent du sujet.

 

Ce faisant, l'utilisateur retrouve le contexte de l'info qu'il cherche : il peut affiner en utilisant le moteur de recherche interne du site, ou questionner les collaborateurs qui travaillent sur le sujet.

 

Mais ça va au delà des simples fichiers : c'est aussi être capable, grâce au moteur de trouver l'accès à certains outils. Cela améliorer de façon certaine le quotidien des collaborateurs.

 

C'est par exemple lui permettre de trouver rapidement l'outil qui lui permet de gérer ses notes de frais, sans chercher dans les méandres de l'intranet.

 

Enfin, c'est améliorer son efficacité propre, en lui proposant en retour de recherche les liens vers les outils internes (ou internet) qui lui sont utiles pour travailler.

Pour plus d'informations, d'explications et de conseils sur ce sujet, je vous recommande la lecture du livre qui aborde ce sujet dans un chapitre complet.

 

Disponible sur AMAZON en format papier, ou format électronique Amazon Kindle et iBook iPad (3,99 €)

 

 

Besoin d'accompagnement sur ce sujet ?

 

Pour tout besoin d'accompagnement sur ces sujets, analyse de situations, conseils et recommandations, n'hésitez pas à vous rapprocher de la société ABALON

(contact : nathalie.guimonet@abalon.fr