URL: https://linuxfr.org/news/sortie-de-datafari-5-3-moteur-de-recherche-open-source-pour-entreprise Title: Sortie de Datafari 5.3, moteur de recherche open source pour entreprise Authors: Datafarian00 Ysabeau, Benoît Sibaud et Pierre Jarillon Date: 2022-10-04T11:29:59+02:00 License: CC By-SA Tags: java, moteur_de_recherche, solr, lucene, apache2, bigdata et connaissance Score: 4 Nous sommes heureux de vous annoncer la mise à disposition de Datafari 5.3. Pas mal de changements depuis la version 5.0 sur laquelle nous avions communiqué, on en fait la liste un peu plus bas. Pour rappel, Datafari est une solution de recherche pour entreprise. Où que les connaissances se trouvent et sous quelque format que ce soit, elle permet aux employés de retrouver les données utiles. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées. On parle également de fédération des connaissances et des savoirs au sein d’une organisation. Pour cette dépêche, on se concentre sur la version libre et open source (mais il y a aussi d’autres nouveautés sur la version entreprise propriétaire). ---- [Page de téléchargement](https://www.datafari.com/telechargement.html) [Accéder au code source](https://github.com/francelabs/datafari) [Le forum de discussion ](https://github.com/francelabs/datafari/discussions) [La documentation](https://datafari.atlassian.net/wiki/spaces/DATAFARI/pages/1081354/Introduction) [Le site officiel](https://www.datafari.com/) [La démo en ligne](https://demo.datafari.com/) [Image Docker](https://hub.docker.com/r/datafari/datafari) [La précédente dépêche sur Datafari](https://linuxfr.org/news/sortie-de-datafari-5-0-moteur-de-recherche-open-source-pour-entreprise) ---- ![Page de resultats de recherche dans Datafari](https://www.datafari.com/files/Autocomplete_Search_Results.png) Les nouveautés et changements principaux par rapport à la 5.0 version Communautaire Open Source : 1. isolation d’Apache Tika dans son propre serveur ; 2. connecteurs pour indexer Jira et Confluence ; 3. option graphique pour redémarrer Datafari ; 4. connecteur simplifié pour indexer les BDD ; 5. passage à DatafariUI, notre nouvelle IHM en React ; 6. optimisation des ressources matérielles par le passage à Apache Zeppelin pour l’analyse des données ; 7. des correctifs un peu partout. Comment démarrer ? ------------------ Pour voir à quoi ça ressemble, nous avons téléversé une courte [vidéo de démonstration](https://www.youtube.com/watch?v=SfSids3Cl6k). Pour démarrer tout de suite, le mieux est d’aller lire le [quick start guide](https://datafari.atlassian.net/wiki/spaces/DATAFARI/pages/66125825/Quick+Start+Guide). Nous mettons gratuitement à disposition notre [documentation Datafari](https://datafari.atlassian.net/wiki/spaces/DATAFARI/pages/1081354/Introduction) sur Confluence, qui couvre les usages, l’administration et le développement. Pour rappel, on trouvera ci-dessous les principales fonctionnalités de Datafari en tant que moteur de recherche. Que peut‐on faire avec Datafari ? --------------------------------- Datafari est un moteur de recherche pour entreprise : membres de la famille des outils de gestion des connaissances, les solutions de recherche fédèrent les connaissances en analysant et indexant tous les documents d’une organisation, aussi bien leur contenu que leurs métadonnées. Pour cela, le moteur de recherche doit être multi‐sources, multi‐formats, et gérer la sécurité. En outre, il faut permettre l’administration de l’outil. ### Dans la version libre, on peut, côté admin : 1. administrer les connecteurs aux sources de données vers de nombreuses sources (nous utilisons Apache ManifoldCF avec tous ses connecteurs) dont Sharepoint, Confluence, Alfresco et les partages de fichiers ; 2. gérer l’algorithme de pertinence qui classe les documents pour leur affichage suite à une requête ; 3. mettre en avant des documents pour des requêtes identifiées ; 4. créer des utilisateurs et leur assigner des rôles ; 5. voir des statistiques d’usage de l’outil ; 6. vréer l’équivalent de Google AdWords (appelés promoliens) ; 7. gérer des synonymes ; 8. plein d’autres choses accessibles depuis la documentation Confluence. ### Côté utilisateur, on peut : 1. chercher de façon simple ou avancée ; 2. prévisualiser les résultats ; 3. bénéficier de la correction orthographique et de l’auto‐complétion ; 4. choisir et utiliser des facettes pour filtrer les résultats ; 5. mettre des résultats dans un panier de favoris ; 6. créer des alertes par courriel quand des documents modifiés ou nouveaux correspondent à une requête. Et ensuite ? ------------ Pour 2023, nous passerons à Datafari 6 avec Solr 9, qui permettra de démarrer des travaux de R&D sur la recherche vectorielle en natif. En parallèle, nous travaillons à l’intégration de modules d’extractions d’entités à la phase d’indexation. Des commentaires ? ------------------ Nous sommes en permanence à l’écoute des commentaires et suggestions pour faire avancer le produit, alors profitez-en, que ce soit d’un point de vue technique ou fonctionnel, ça nous intéresse. Ha et si vous l'utilisez déjà, n’hésitez pas à en parler sur le web !