Paramètres avancés (Analyseur de contenu)

Pour spécifier la langue du contenu, traiter les documents rejetés et utiliser des balises d'analyseur de contenu :

  1. Dans la liste déroulante sous Langue du contenu, choisissez la langue utilisée dans la majorité du contenu que vous souhaitez importer.

  2. Sous Documents rejetés, spécifiez la façon de traiter les documents ne pouvant pas être rangés dans un dossier à l'issue du tri :

  3. Si vous modifiez un analyseur de contenu existant, des options supplémentaires visibles sous Documents rejetés vous permettent de spécifier la marche à suivre quand cet analyseur de contenu trouve un document déjà rejeté. La définition de "déjà rejeté" dépend de l'option choisie à l'étape 4b :

  4. Spécifiez la façon de traiter les documents déjà rejetés :

    En cas de nécessité absolue, vous pouvez supprimer l'historique des documents déjà rejetés. Là encore, la définition de "déjà rejeté" dépend de l'option choisie à l'étape 4b. Si vous choisissez "dans cette source de contenu" à l'étape 4b, vous supprimez l'historique des rejets de tous les analyseurs de contenu qui importent des documents depuis cette source de contenu. Si vous êtes toujours convaincu de devoir supprimer l'historique des documents déjà rejetés, cliquez sur Effacer l'historique de rejet.

    Remarque : si un document n'est classé dans aucun dossier et se trouve par conséquent dans le dossier Documents non classés, il ne sera pas considéré comme rejeté. Les documents rejetés sont des documents qui n'ont été placés dans aucun dossier.

  5. Si vous êtes en train de modifier un analyseur de contenu existant, la section Importation de documents est visible. Sous Importation de documents, précisez si l'importation doit être limitée aux nouveaux documents. Par défaut, cet analyseur de contenu ne s'occupe que d'importer les nouveaux documents (ceux qui n'ont pas encore été importés par cet analyseur de contenu ou par d'autres analyseurs de contenu ayant accès à cette même source de contenu). Vous pouvez changer les paramètres de l'analyseur de contenu pour importer plusieurs exemplaires de chaque document, ce qui peut être utile pendant la phase d'essai de vos analyseurs de contenu.

    1. Pour importer uniquement de nouveaux documents, sélectionnez Importer uniquement les nouveaux liens et de nouvelles options apparaissent ; sinon, passez à l'étape 5.

    2. Pour préciser la signification de " nouveaux liens " :

    3. Remarque : l'option que vous choisissez ici affecte les actions de l'étape 3 et de l'étape 4f.

    4. Pour actualiser les documents déjà importés selon les spécifications de la page Paramètres des documents, sélectionnez les actualiser. En règle générale, l'actualisation des documents est assurée par l'agent d'actualisation de document car le processus d'actualisation des documents tend à ralentir l'analyseur de contenu. Cependant, si vous avez changé les paramètres de document pour cet analyseur de contenu ou changé les correspondances de propriétés dans les types de contenu associés, le fait d'actualiser les documents a pour effet de mettre ces paramètres à jour pour les documents déjà importés.

      Remarque :
      si vous analysez un flux RSS, l'option Les actualiser actualise les propriétés (telles que le titre et la description) avec les valeurs des documents cible et non du flux RSS. Si vous voulez conserver les propriétés du flux RSS, ne sélectionnez pas Les actualiser.

    5. Si vous avez créé des dossiers supplémentaires ou appliqué des filtres différents aux dossiers de destination, sélectionnez essayer de les trier en dossiers supplémentaires pour trier les documents déjà importés dans de nouveaux dossiers du répertoire de connaissances.

      Il est possible qu'un autre analyseur de contenu ait importé des documents depuis la même source de contenu mais dans des dossiers différents des dossiers de destination spécifiés pour cet analyseur de contenu. Soyez certain de vouloir trier à nouveau ces documents dans les dossiers de destination spécifiés pour cet analyseur de contenu.

    6. Pour réimporter des documents déjà supprimés (manuellement, pour cause d'expiration ou pour cause d'absence des documents source), sélectionnez régénérer les liens supprimés. Il est possible que cela réimporte des documents qui avaient été jugés ne pas convenir à votre portail.

    7. En cas de nécessité absolue, vous pouvez supprimer l'historique des documents ayant été supprimés du portail. Le terme "Historique" est interprété en fonction de la définition des nouveaux documents à l'étape 3b :

    8. Si vous êtes toujours convaincu de devoir supprimer l'enregistrement des documents supprimés du portail, cliquez sur Effacer l'historique des suppressions.

  6. Pour marquer les documents importés à l'aide d'une balise d'analyseur de contenu, tapez le texte de la balise dans la zone Marquer les documents importés avec la balise d'analyseur de contenu suivante. Cette balise sert à différencier les documents importés par cet analyseur de contenu de ceux importés par un autre analyseur de contenu.

  7. Sous Configuration d'exécution, faites les réglages ci-dessous :

  8. Les plages autorisées pour ces champs sont indiquées dans le fichier de configuration de portail. Les valeurs définies dépendent également du nombre maximum de threads autorisés par le service d'automatisation utilisé pour cette tâche associée à cette source de contenu.


  1. Cliquez sur Administration.
  2. Ouvrez l'Editeur d'analyseur de contenu :
  3. A gauche, sous Modifier les paramètres d'objet, cliquez sur Paramètres avancés.