Pour configurer cet analyseur de manière à ce qu'il n'importe aucune page web non désirée dans le portail :
Par défaut, cet analyseur applique les recommandations
du serveur web concernant le choix des pages intéressantes pour les analyseurs
automatisés. Si vous préférez ne pas appliquer ces recommandations, désélectionnez
l'option Obéir aux protocoles automatiques
d'exclusion du site destinataire.
En règle générale, ces recommandations permettent de limiter les analyses
d'un contenu jugé indésirable dans le portail. Cependant, certains sites
proposent des recommandations très strictes. S'il s'avère que votre analyseur
n'importe aucun contenu d'un site, essayez de désactiver cette option.
Par défaut, cet analyseur enregistre les URL des pages web importées en fonction de la casse de caractères utilisée sur le site d'origine. Pour changer les URL en minuscules, sélectionnez Convertir toutes les URL en minuscules.
Pour éviter d'importer du contenu venant d'une certaine partie d'un site web ou pour éviter d'importer des pages particulières :
Pour indiquer une zone à éviter, cliquez sur
Ajouter
un filtre d'exclusion, puis, dans la zone de texte, entrez l'URL
de la zone du site Web à éviter.
Vous pouvez utiliser le caractère générique * pour rendre
l'exclusion plus générale. Par exemple, pour ne pas analyser les liens
des informations de ventes d'un site, vous pouvez entrer http://mycompany.com*sales.
Par conséquent, cet analyseur de liens (crawler) n'importera pas les pages
de mycompany.com dont l'URL contient le mot "sales" (ventes).
Remarque : les caractères génériques sont utilisés
de chaque côté du texte. Par exemple, si vous entrez sales, l'analyseur de liens n'importera aucune
page d'aucun site accessible
à partir de l'URL cible contenant le mot "sales".
Important : si vous répertoriez des exclusions et des inclusions (décrit à l'étape 5),
les exclusions sont uniquement appliquées aux pages incluses.
Par exemple, si vous excluez sales et
incluez http://mycompany.com,
l'analyseur de liens importera toutes les pages de http://mycompany.com,
sauf celles dont l'URL contient
le mot "sales".
Pour supprimer une exclusion, sélectionnez
celle-ci et cliquez sur .
Pour sélectionner ou désélectionner toutes les cases des exclusions, sélectionnez ou désélectionnez la case située à gauche de Exclusions.
Par défaut, cet analyseur n'analyse et n'importe aucune des pages désignées dans les exclusions. Si votre analyseur doit partir du lien d'une page exclue pour se rendre sur une page non exclue qui elle-même doit être importée, choisissez l'option Analyser les pages exclues, mais ne pas les importer.
Pour limiter l'analyse à une partie d'un site web ou à des pages particulières :
Pour indiquer le champ d'application de cet
analyseur de liens (crawler) de contenu, cliquez sur Ajouter un filtre d'inclusion,
puis, dans la zone de texte, entrez l'URL de la zone du site Web
à laquelle restreindre l'analyse de liens. Dans la mesure où les sites Web
peuvent contenir des liens vers d'autres sites, vous pouvez utiliser des
inclusions pour conserver l'analyseur de liens sur un site donné. Pour
éviter d'analyser les liens d'autres sites, ajoutez l'URL de base du site
dont les liens sont à analyser à la liste des inclusions ; par exemple,
http://mycompany.com.
Vous pouvez utiliser le caractère générique * pour rendre
l'inclusion plus générale. Par exemple, pour analyser uniquement les liens
des informations SSO, entrez http://mycompany.com*sso.
Par conséquent, cet analyseur de liens de contenu importera uniquement
les pages de mycompany.com dont l'URL contient "sso".
Remarque : les caractères génériques sont utilisés
de chaque côté du texte. Par exemple, si vous entrez sso, l'analyseur de liens de contenu importera
toutes les pages de tous les
sites accessibles à partir de l'URL cible contenant "sso".
Important : si vous répertoriez des inclusions et des exclusions, les exclusions sont
uniquement appliquées aux pages incluses.
Par exemple, si vous incluez http://mycompany.com
et excluez sso, l'analyseur de
liens de contenu importera toutes les pages de http://mycompany.com, sauf celles dont l'URL contient "sso".
Pour supprimer une inclusion, sélectionnez
celle-ci et cliquez sur .
Pour sélectionner ou désélectionner toutes les cases des inclusions, sélectionnez ou désélectionnez la case située à gauche de Inclusions.
Pour afficher la page associée à cette rubrique d'aide :