Créez un analyseur de liens (crawler) de contenu pour importer les données des référentiels de contenu externes dans le portail. Vous devez exécuter une tâche associée à l'analyseur de liens de contenu pour rechercher périodiquement le contenu dans le référentiel externe et l'importer. Pour plus d'informations sur les tâches, consultez la rubrique A propos des travaux.
Remarque : les analyseurs de liens (crawler) de contenu dépendent des sources de contenu. Pour plus d'informations sur les sources de contenu, consultez la rubrique A propos des sources de contenu.
Cette rubrique aborde les sujets suivants :
Pour savoir comment créer ou modifier des objets administratifs (notamment des analyseurs de liens (crawler) de contenu), cliquez ici.
Un analyseur de liens (crawler) de contenu Web permet aux utilisateurs d'importer le contenu du Web vers le portail.
Pour en savoir plus sur l'éditeur d'analyseur de liens (crawler) de contenu Web, cliquez sur l'une des pages de l'éditeur ci-dessous :
Un analyseur de liens (crawler) de contenu distant permet aux utilisateurs d'importer les données d'un référentiel de contenu externe dans le portail.
Certains fournisseurs d'analyse de liens sont installés sur le portail et immédiatement disponibles aux utilisateurs du portail, alors que d'autres nécessitent une installation et une configuration manuelles. Par exemple, Oracle propose les fournisseurs d'analyse de liens suivants :
Remarque : pour plus d'informations sur l'obtention de fournisseurs d'analyse de liens, reportez-vous au site Oracle Technology Network à l'adresse suivante : http://www.oracle.com/technology/index.html. Pour plus d'informations sur l'installation des fournisseurs d'analyse de liens, reportez-vous au manuel Installation Guide for Oracle WebCenter Interaction (disponible sur le site Oracle Technology Network à l'adresse suivante : http://www.oracle.com/technology/documentation/bea.html) ou à la documentation fournie avec le fournisseur d'analyse de liens. Sinon, contactez l'administrateur du portail.
Pour créer un analyseur de liens (crawler) de contenu distant, procédez comme suit :
Pour en savoir plus sur l'éditeur d'analyseur de liens (crawler) de contenu distant, cliquez sur l'une des pages de l'éditeur ci-dessous :
Les fournisseurs d'analyse de liens suivants, lorsqu'ils sont installés, rajoutent au moins une page supplémentaire à l'éditeur de l'analyseur de liens (crawler) de contenu distant.
Les services Web de contenu permettent d'indiquer des paramètres généraux pour le référentiel de contenu distant ; la définition de paramètres cible et de paramètres de sécurité se fait donc dans les sources de contenu distantes et dans les analyseurs de liens (crawler) de contenu distants associés. Cela permet d'analyser les liens de plusieurs emplacements du même référentiel de contenu sans devoir indiquer plusieurs fois les paramètres.
Remarque : vous créez des services Web de contenu sur lesquels baser les sources de contenu distantes. Pour plus d'informations sur les sources de contenu, consultez la rubrique A propos des sources de contenu.
Pour en savoir plus sur l'éditeur de service Web de contenu distant, cliquez sur l'une des pages de l'éditeur ci-dessous :
Les utilisateurs peuvent bénéficier automatiquement de l'accès au contenu importé par des analyseurs de liens (crawler) de contenu distants. La correspondance de synchronisation ACL globale indique à ces analyseurs de liens de contenu comment importer la sécurité de document source.
Pour savoir comment fonctionne l'import de sécurité, consultez la rubrique Exemple d'importation des paramètres de sécurité.
Vérifiez les éléments suivants si votre analyseur de liens (crawler) de contenu n'importe pas le contenu attendu :
Vérifiez que les filtres de dossier filtrent le contenu correctement. Pour en savoir plus sur le test des filtres, consultez la rubrique Test des filtres de la page Paramètres principaux (filtre).
Vérifiez que l'analyseur de liens (crawler) de contenu n'a pas placé de contenu indésirable dans le dossier cible. Si, par suite du filtrage, un document n'est pas dirigé vers un sous-dossier, il se peut que l'analyseur de liens de contenu place le document dans le dossier cible. Ce paramétrage est défini sur la page Paramètres principaux de l'éditeur de dossiers.
Vérifiez que l'analyseur de liens (crawler) de contenu n'a pas placé de contenu indésirable dans le dossier Documents non classés. Si, par suite du filtrage, un document n'est pas dirigé vers un dossier ou sous-dossier cible, il se peut que l'analyseur de liens de contenu place le document dans le dossier Documents non classés. Ce paramétrage est défini sur la page Paramètres avancés de l'éditeur d'analyseur de liens (crawler) de contenu. Si vous disposez des droits d'accès nécessaires, vous pouvez afficher le dossier Documents non classés lorsque vous modifiez le répertoire ou que vous cliquez sur Administration | Sélectionner un utilitaire | Accès aux documents non classés.
Vérifiez que vous disposez au moins de droits d'accès en modification sur le dossier cible.
Pour les analyseurs de liens (crawler) de contenu Web, veillez à ce qu'aucune exclusion ou une inclusion, ou encore que les protocoles d'exclusion de robot, n'empêchent l'analyseur de liens de contenu d'importer le contenu attendu. Ce paramétrage est défini sur la page Exclusions de pages Web de l'éditeur de l'analyseur de liens de contenu.
Vérifiez que les informations d'authentification indiquées dans la source de contenu associée permettent au portail d'accéder au contenu.
Vérifiez l'historique des tâches pour plus d'informations.