Copyright (c) Martin Lafaix, 1996. Tous droits réservés. ©
Home | Document d'accueil OS/2 | Une sélection des meilleurs utilitaires | SearchManager/2

SearchManager/2

En provenance de l'enfer de la logithèque IBM, voici un produit de la collection rose[1]...

SearchManager/2, qu'est-ce ?

De plus en plus aujourd'hui nous sommes amenés à consulter et conserver des documents d'origines diverses. L'avènement de l'internet, avec ses forums de discussion, son courrier électronique et les serveurs Web font que l'on se retrouve facilement submergé par l'information.

Souvent, on est tenté de sauvegarder une copie de tel document ou tel article, en se disant que cela pourrait servir « plus tard ».

Cependant, lorsque ce « plus tard » arrive, on se souvient seulement d'avoir stocké quelque part cette information. Le problème est de la retrouver.

Même avec une organisation rigoureuse, retrouver un document parmi des milliers de notes, des milliers d'articles conservés tient parfois du miracle.

Pire encore, ce n'est pas forcement vous qui avez archivé ce document, et un emplacement logique pour l'un ne l'est pas toujours pour l'autre.

La plupart des traitement de textes permettent de définir des mots clefs pour caractériser un document, et avec OS/2, le Shell du bureau électronique permet de spécifier également des mots clefs pour tout document, quelque soit sa nature. Mais ces informations sont rarement données et se révèlent souvent incomplètes, et donc inutilisables.

Le besoin d'outils permettant de résoudre ces problèmes se fait donc sentir, que l'on utilise un poste connecté ou non.

SearchManager/2 est l'un d'eux. Son but est de rechercher des documents en fonction de leurs contenus. En d'autres termes, et pour faire bien, c'est un programme de recherche documentaire.

Où et comment obtenir SearchManager/2 ?

SearchManager un produit commercial d'IBM. On peut se le procurer auprès de son revendeur préféré.

Ce produit est disponible en version monoposte ou client-serveur[2].

Les références produit pour les versions contenant les dictionnaires Anglais (États-Unis) et Français sont :

La version en cours correspond au niveau de service 18 (CSD 8).

Une version de démonstration est également disponible via l'offre IBM Developer Connection. Cette version est totalement fonctionnelle, mais ne gère qu'un maximum de 50 documents, et ne contient que le dictionnaire Anglais (États-Unis).

Des dictionnaires additionnels (Danois, Norvégien, Néerlandais, Portugais, Français (France), Espagnol, Allemand, Suédois, Allemand (Suisse), Anglais (Royaume-Uni), Islandais, Anglais (États-Unis) et Italien pour l'Europe (EMEA) et Danois, Italien, Néerlandais, Norvégien, Français (France), Portugais, Français (Canada), Espagnol, Allemand, Suédois pour les États-Unis), ainsi qu'un thésaurus sont disponibles en option.

Présentation et installation

La version monoposte française de SearchManager/2 se présente sous la forme de 6 disquettes et de deux manuels : Guide de recherche et d'indexation, en français (180 pages), et Programming Interfaces for AIX, OS/2 and Windows, en anglais (260 pages). Une version « en ligne » du Guide de recherche et d'indexation est également fournie.

Le produit utilise le programme d'installation standard d'OS/2, et occupe près de 10Mo si tous les composants sont sélectés. Cette occupation du disque peut être réduite puisque les dictionnaires sont les mêmes que ceux utilisés par IBM Works et EPM (l'Éditeur Plus).

Il est nécessaire de relancer le système avant de pouvoir utiliser SearchManager/2.

Cinq classes sont ajoutées au système, et un dossier est rajouté sur le bureau.

sm4.gif

Note: Il est conseillé de lire le Guide de recherche et d'indexation avant de procéder à l'installation, afin de connaître les possibilités du produit, mais, après, vous pouvez sans crainte le ranger, l'utilisation de SearchManager/2 étant vraiment très simple et intuitive.

Rechercher un document

SearchManager est une application conforme à CUA 91. Elle est constituée d'objet que l'on manipule comme les autres. L'abord est donc particulièrement intuitif pour qui connaît le Shell du bureau électronique d'OS/2.

sm0.gif Pour rechercher un document, il suffit d'ouvrir un objet Requête. Les requêtes étant des objets comme les autres (en fait une sous-classe des dossiers), on peut soit (1) recopier une requête existante pour s'en inspirer, soit (2) utiliser un modèle de requête, comme celui présent dans le dossier Modèles.

La vue par défaut d'une requête présente un bloc-notes permettant de spécifier la recherche à effectuer. Pour chaque requête, on peut spécifier sur quels documents elle doit porter, et pour chaque terme de la requête, on peut préciser si les synonymes doivent être recherchés, si la recherche doit porter sur le terme exact, ou également sur ses dérivés, etc. Des caractères de substitution peuvent être utilisés dans les termes, pour représenter une ou plusieurs lettres (par exemple « *texte » recherche les documents contenant « texte », « contexte », « prétexte », etc. « rapport * annuel » recherche les documents contenant « rapport budgétaire annuel », « rapport vente annuel », « rapport annuel », etc.).

sm1.gif

Une des forces de SearchManager est cette recherche des termes dérivés. Par exemple, si vous spécifiez comme terme de recherche « oeil », les documents contenant « yeux » seront aussi trouvés (les pluriels plus simples sont bien sûr gérés). Même chose pour les formes conjuguées des verbes. Ceci augmente considérablement la probabilité de retrouver un document.

Une autre force de SearchManager est la gestion des documents multilingues. Par exemple, si vous recherchez des termes en anglais, seuls les documents en cette langue seront retournés (si certains documents contiennent des paragraphes en anglais et d'autres en français, la recherche ne portera que sur les premiers -- à condition bien sûr que le format employé retienne cette information, comme par exemple WordPerfect).

Note: Une requête étant un objet comme les autres, son contenu (spécification plus résultat) est préservé d'une session à l'autre. Il est naturel d'avoir plusieurs modèles de requête, pour des usages différents.

sm2.gif Lorsque la requête est complètement définie, une vue contenant les documents correspondants s'ouvre en sélectant la plaquette Recherche.

Les objets contenus dans le dossier sont des doubles des originaux. On peut donc les manipuler normalement (et les imprimer, supprimer, renommer, etc.).

On peut alors visualiser ces documents, en utilisant soit le browser par défaut, soit une application associée au document. Utiliser le browser par défaut a l'avantage d'être rapide et de mettre en évidence les termes recherchés, mais ne permet pas de modifier le document.

sm3.gif

Note: SearchManager offre en plus une API, qui permet de l'utiliser à partir de ses propres applications. La documentation de cette API est inclue, ainsi que le kit de développement associé.

L'indexation

Rien en ce bas monde n'étant gratuit, la puissance apportée par SearchManager a un coût : les documents doivent être indexés.

L'index occupe un espace représentant entre 60 et 70% de celui des documents indexés.

Cet index, et le fait qu'OS/2 ne gère pas simplement des fichiers de plus de 2Go, est la cause d'une limitation de SearchManager/2 : comme un index primaire et un index secondaire sont utilisés, ils occupent au plus 4Go, ce qui fait que le volume total des données indexées ne peut excéder environ 6Go. Ce n'est guère gênant aujourd'hui pour une utilisation individuelle, mais, en entreprise, on peut facilement atteindre de tels volumes. Il reste cependant possible d'utiliser plusieurs index ou plusieurs serveurs...

Pourquoi indexer les documents ?

Si les documents n'étaient pas indexés, à chaque recherche, l'ensemble des documents devrait être lu. Les temps de recherche rendraient alors inutilisable le produit.

L'utilisation d'un index permet lors d'une recherche de n'avoir à parcourir que celui-ci pour trouver les fichiers intéressants, ce qui fait que le résultat est disponible en quelques secondes ou dizaines de secondes au lieu de minutes, voire d'heures.

Comment indexer les documents ?

On peut procéder de deux manières pour indexer les documents. La première consiste à le faire au coup par coup. C'est la plus simple si les documents ne changent pas beaucoup.

La seconde consiste à automatiser cette indexation. Elle se fera alors à intervalle régulier, par exemple la nuit lorsque le poste est inactif. Seuls les documents modifiés ou nouvellement créés seront (ré)indexés.

SearchManager/2 permet de choisir entre ces deux méthodes. Si vous optez pour la première, il suffit de faire glisser les documents (ou les dossiers les contenants) vers l'index de documents. Si vous choisissez la seconde, vous pouvez spécifier des fréquences différentes suivant les répertoires à indexer en sélectant l'option Administration du menu contextuel de l'index de documents.

Vous pouvez également préciser quand ou à quel intervalle purger l'index, afin d'effacer les références à des fichiers n'existant plus.

Que peut-on indexer ?

Les formats suivants sont reconnus :

Note: Si vous développez des applications, n'oubliez pas que le code source de celles-ci peut être indexé, puisqu'après tout ce ne sont que des fichiers ASCII. Vous pourrez alors aussi rechercher dans quels modules vous utilisez telle ou telle fonction.

Les documents peuvent se trouver sur un disque sous forme de fichiers ou dans une base de documents Notes. Si le besoin s'en fait sentir, vous pouvez développer votre propre système de stockage de documents (par exemple pour stocker les documents dans une base de donnée, comme DB2/2).

Conclusions

SearchManager/2 souffre d'un problème, auquel nous sommes hélas habitués : qui avant de lire cet article avait connaissance de ce produit ? Et qui savait qu'il existe depuis 1993 ? Et que la version monoposte coûte environ 500 FRF (oui, cinq cents francs) ?

Pendant ce temps, on voit paraître dans les revues spécialisées des articles élogieux sur des produits qui n'arrivent pas à la cheville de SearchManager/2.

Je sais bien que je n'ai aucune connaissance en marketing, mais il me semble que pour qu'un produit se vende, il faut tout de même en parler un peu, non ?

Bon, assez crié :-) Précipitez-vous sur votre téléphone ou sur votre revendeur, et achetez-le ! (Et faites attention, le prix en France était jusqu'à il y a peu erroné : le prix officiel réel est de 570 FRF HT pour la version monoposte.)


Notes:
[1] La collection rose, c'est la série des Information Retrieval Programs, tous livrés dans une boîte rose et mauve. Gloups :-)
[2] Il existe aussi des versions de SearchManager sur AIX et System/370. Un client Windows existe également, mais il nécessite un serveur OS/2.

Martin Lafaix