|
|
NUMÉRISATION
BASES DE
RECHERCHE
| |
|
.:
Approche et prestations :. |
|
|
|
| |
Pour
plus de détails sur nos services de numérisation
|
Comment repérer les documents
numérisés? C'est l'aspect trop souvent
négligé, mais pourtant crucial. LARMUR offre un arsenal d'outils de recherche,
utilisés en combinaison ou isolément, selon le
contexte. Ces outils vont d'un
"simple index" à la recherche plein
texte. L'analyse préalable à la
numérisation permet de déterminer le choix
optimal. De plus, nous
pouvons diffuser des documents numérisés par
CD, en chargeant vos propres serveurs ou en
hébergeant des catalogues sur nos propres
serveurs!
Nous déterminons conjointement avec le
client s'il est préférable d'élaborer un
système de repérage par indices (indexation,
classification) et/ou de soumettre les documents
numérisés à l'OCR (Reconnaissance Optique de
Caractères) en vue d'une recherche plein-texte.
Si les besoins du Client sont très pointus,
si une recherche plein-texte absolument
exhaustive est requise ou s'il désire éditer
les documents numérisés, nos techniciens
spécialisés peuvent vérifier et corriger le
résultat de l'OCR. Toutefois, dans la
plupart des cas, cette étape est
superflue. Notre taux de reconnaissance
atteint presque la perfection, même dans le cas
de documents fortement dégradés.
Les caractères non-reconnus sont gérés par des caractéristiques de
recherche évolués, comme la recherche floue,
la tolérance à l'erreur, etc.
|
Retour élevé
de l'investissement:
- Recherche par champs indexés (nom, date,
type, cote, identification...).
- Possibilité de recherche plein-texte.
- Possibilité de numériser des documents
couleurs.
- Lien vers des fichiers électroniques (Web,
PDF, CD-ROM).
- Possibilité d'Échange Électronique de
Données avec d'autres applications.
- Accès distant et publication
électronique des contenus (Web).
- Possibilité d'intégration à d'autres
applications de stockage/repérage
documentaires...
|
Recherche plein-texte:
|
Notre système offre les options
de recherche suivantes:
- terme simple ou expression, avec
opérateurs booléens (et/ou/sauf)
- recherche en langage naturel, avec tri
de pertinence, celle-ci étant calculée
selon la "densité des occurences"
et la rareté des termes de recherche
(ainsi, les mots qui apparaissent
plus rarement dans les documents
recevront un rang de pertinence plus
élevé)
- recherche floue, avec une tolérance
à l'erreur pouvant être fixée de 1
à 10, permettant ainsi de passer
outre les erreurs typographiques; il
est alors possible d'effectuer des
recherches efficaces même si le taux
de réussite de l'OCR est faible
- lemmisation, pour trouver les diverses
variations d'un mot (comme
"appliquer",
"application", etc.)
- recherche phonétique, pour trouver
des mots de même consonnance (comme
Smith et Smythe)
- recherche par thésaurus, pour trouver
des concepts ou synonymes liés...
Les Webmestres peuvent facilement
personnaliser les formulaires de recherche afin
d'inclure ou d'exclure l'une ou l'autre de ces
options.
|
Indexation / Classification:
|
Voici quelques exemples de critères
d'indexation pouvant être appliqués:
- Numéro du périodique
- Nom de l'immeuble
- Nom du projet
- Type de document
- Nom du client
- Date de révision
- Titre du dessin
- Nom du fichier numérique
- Numéro de police
- Numéro de réquisition...
|
|
|
|
| |
|
|
| |
|
.:
Distribution CD/DVD :. |
|
|
|
| |
|
Nous pouvons transformer vos documents imprimés,
microfilmés ou électroniques en une base de données
textuelles recherchable en langage naturel, avec
hyperliens, distribuée sur CD-ROM ou DVD. Parfait
pour toute collection non-linéaire (comme des manuels
de réparation, documents de référence,
documents légaux volumineux, travaux historiques,
etc.), ou linéaire (journaux, bons de commandes,
etc.), notre système permet de retracer toute
l'information voulue, avec un lien sur l'image
originale des documents!
|
|
|
| |
|
|
|
|
Copyright © 2005 LARMUR inc., tous droits
réservés.
|