accueil favoris newsletter 
l'information professionnelle des progiciels de gestion intégrés
ACTUALITES RUBRIQUES INTERVIEWS NEWSLETTERS OUTILS INSCRIPTIONS A PROPOS
 
 
DEPECHES    
delaware France recrute massivement en 2020
20/01/2020 delaware France est un intégrateur et partenaires de SAP sur le marché français. Il poursuit sa forte croissance et annonce l'ouverture de plus de 100 postes pour compléter ses équipes dans l'ensemble de ses agences de L ...
Le contenu de formation Litmos désormais accessible aux utilisateurs de Salesforce
18/01/2020 SAP a annoncé une nouvelle édition entreprise de la solution de formation SAP Litmos, avec plus de 2 000 cours vidéo ou téléchargeables, dont 150 cours destinés aux professionnels de l'expérience client. Cette nouvelle é ...
Alten inaugure une nouvelle agence à Mulhouse
18/01/2020 200 nouveaux collaborateurs seront recrutés courant 2020 dans toute la région Grand-Est, dont 100 postes à pourvoir pour cette seule nouvelle agence de Mulhouse. Située dans le bâtiment Andrinople, au sein du quartier d' ...
Cegid confirme sa place dans le dernier classement RIS Software Leaderboard
17/01/2020 Comparé au classement de l'année 2018, Cegid maintient sa place dans le top 3 dans les catégories Top Large Vendor et Top Apparel Vendor au niveau mondial, confirmant la portée de ses investissements réalisés dans le ret ...
Hitachi Solutions présente l'offre Essentials,
17/01/2020 Cette offre packagée est destinée à répondre efficacement aux attentes spécifiques des sociétés de services.
Le groupe Isatech rachète la société Tryade
16/01/2020 ESN spécialisée dans l'intégration de solutions Microsoft et labellisé Microsoft Gold Partner, le groupe Isatech vient d'acquérir la société nantaise Tryade, expert en infrastructures cloud, sécurité et solutions collabo ...
Infor présente de nouvelles solutions omnicanales pour les détaillants et les enseignes du secteur de la mode
15/01/2020 Ces solutions, fondées sur le machine learning, permettront d'optimiser les stocks, d'améliorer la planification de la demande et de l'approvisionnement, de renforcer l'efficacité des sites de production et d'accélérer l ...
toutes les dépêches
 
DU COTE DES UTILISATEURS    
Le CHU de Nantes se transforme en hôpital numérique
14/01/2020 Avec la mise en place du nouveau Groupement Hospitalier Territorial (GHT) du département de Loire Atlantique il y a quelques années, le Centre Hospitalier Universitaire de Nantes, en plus de sa mission de service public ...
Sanofi soigne ses processus financiers en misant sur l'automatisation de ses procédures R2R
19/12/2019 En déployant la solution centralisée Cadency de Trintech pour gérer l'intégralité de ses processus financiers opérationnels, l'entreprise pharmaceutique a gagné en efficacité et en visibilité tout en améliorant sa confor ...
tous les témoignages
 
COMMUNIQUES DE PRESSE    
71% des Directeurs Administratif et Financier (DAF) considèrent jouer un rôle central dans la réussite de la transformation digitale de leur entreprise
24/10/2022 Esker, plateforme cloud mondiale qui valorise les métiers de la finance et du service client en automatisant les cycles de gestion, a mandaté OpinionWay pour prendre le pouls des directions financièr ...
Comment les Services Clients & Administration Des Ventes (ADV) ont-ils évolué depuis la crise sanitaire ?
27/09/2022 Esker, Citwell et Praxis dévoilent les résultats de la 2e édition de leur étude sur la maturité des Services Clients/Administration Des Ventes (ADV) en France depuis la crise sanitaire 2020. Près de 1 ...
Esker automatise la gestion des commandes clients de Suntory Beverage & Food Spain, améliorant ainsi sa chaîne logistique
12/09/2022 Esker, plateforme cloud mondiale qui valorise les métiers de la finance et du service client en automatisant les cycles de gestion, annonce que Suntory Beverage & Food Spain est désormais accompagné p ...
tous les communiqués
 
 
Articles    
Le sens de la sémantique
 
22/02/2010 :: Une très grande confusion règne autour du mot "sémantique" qui est utilisé à toutes les sauces dès qu'il s'agit de moteurs de recherche, et force est de constater que les discours marketing des acteurs ne vont pas dans le sens de la clarté.

Tout d'abord, il y a l'indexation sémantique : celle qui consiste, lors de l'analyse d'un document, à rattacher chaque mot à un concept sous-jacent. Par exemple, pour le mot jaguar, il faut déterminer s'il s'agit du félin, de la voiture, de l'avion ou du système d'exploitation. Et ça, c'est compliqué. Tout d'abord, il faut une "liste" de concepts cibles (le sens qui est derrière le mot) pour pouvoir transformer le mot en concept. Il faut donc avoir modélisé tous les concepts. Autant dire que c'est peine perdue : cela sous entendrait que tout le monde pense de la même façon et se représente le monde à l'identique. Ensuite, il ne faut pas se tromper lors de l'analyse : faux amis, ambiguïté? Et d'ailleurs, tout ça est tellement compliqué que ça n'a jamais marché. C'est sans doute une des grandes errances et un Graal illusoire des moteurs de recherche des années 80-90. Les acteurs de ce domaine se sont dès lors fixé des objectifs plus modestes, mais dont les résultats sont plus probants : extraction d'entités nommées, datamining, etc.

Puis il y a l'extension sémantique. Là, plus de concepts, mais seulement des vocabulaires : dictionnaires de synonymes, thésaurus, taxinomies. Le principe est simple : élargir la recherche de l'utilisateur en exploitant les synonymes (même sens), les hyperonymes (sens plus large : véhicule est hyperonyme de voiture et camion) et les hyponymes (sens plus réduit). Et donc, si l'utilisateur cherche une chemise verte, il est de bon ton de lui remonter aussi des chemises kaki ou émeraude. C'est ça l'extension sémantique : étendre la recherche de l'utilisateur en appliquant des dictionnaires. Et si possible uniquement du vocabulaire spécifique à domaine et à un objectif fonctionnel afin de ne pas introduire de bruit. Cette méthode, associée à des traitements linguistiques de type lemmatisation, a largement pris le pas sur les autres car elle offre à la fois de bonnes performances tout en garantissant un coût de mise en ?uvre et de maintenance réduit.

Il y a aussi l'indexation sémantique latente (LSI : Latent Semantic Indexing). C'est une approche mathématique datant des années 80 qui a pour objectif d'analyser la relation entre les mots dans le contexte des documents. Le LSI permet ainsi de mettre en évidence que le mot jaguar apparaît dans certains cas en même temps que les mots avion, vol, combat, sepecat? ; dans d'autres cas avec les mots félin, carnivore, prédateur, forêt? ; ou encore avec les mots voiture, rapide, moteur, luxe? Ces différentes corrélations et leurs disjonctions permettent de déduire que le mot jaguar est polysémique (a plusieurs sens) et qu'il convient donc de catégoriser les réponses en fonction de ces sens, voire même d'offrir à l'utilisateur la possibilité de préciser sa recherche pour lever l'ambigüité. Le LSI a cependant montré de nombreuses limites (modèle non génératif, passage à l'échelle?) mais il a relancé l'intérêt de la communauté scientifique pour les méthodes purement mathématiques appliquées au traitement de la langue. Avec le PLSI (Probabilistic Latent Semantic Indexing) et le LDA (Latent Dirichlet Allocation), de nouvelles approches statistiques particulièrement prometteuses se dessinent.

J'en arrive enfin au web sémantique. Et c'est certainement là que règne la plus grande confusion. Car contrairement à ce que le mot "sémantique" laisse suggérer, il ne s'agit pas pour les moteurs de recherche de découvrir les concepts et le sens caché des textes. Bien au contraire. Il s'agit d'expliciter manuellement le sens des informations afin que les ordinateurs puissent les exploiter de façon automatique, sans ambigüité et à grande échelle. Prenons un exemple : sur le site web d'un restaurant on trouve l'information "ouvert tous les jours sauf le lundi hors période scolaire". Cette phrase est déjà ambiguë pour un humain ("hors période scolaire" s'applique-t-il à "tous les jours" ou à "sauf le lundi" ?) ; mais elle est franchement inexploitable en tant que telle par un moteur de recherche qui vient lire cette page. L'idée sous jacente au web sémantique est donc qu'il faut ajouter dans la page web des informations formelles (grâce à des balises invisibles à l'utilisateur) afin que les logiciels de recherche puissent collecter cette information et l'exploiter.

Le web sémantique est très loin de l'indexation sémantique et des promesses de l'intelligence artificielle des années 80. Pas d'analyse du sens caché, pas de réponse miracle à une question exprimée en langage naturel. Mais c'est sans doute en cela qu'il peut tenir ses promesses. Et comme l'avoue Tim Berners Lee, le mot web sémantique est mal choisi (par lui même) car sujet à trop d'incompréhension, et il suggère d'employer maintenant l'expression "web of data" : le web des données.

Fabrice Lacroix, Président d'Antidot

 
RECHERCHE    
 
TRADUCTION
...
 
OUTILS    
Inscription Newsletter    
Deux éditions mensuelles gratuites
Inscription Annuaire    
L'annuaire des pros
Publicité    
20000 visiteurs par mois
 
ANNUAIRE  
CASTELIS
IRIUM SOFTWARE
TOPSOLID
APRODIX
E-LEARNING Lyon
Fitnet Manager
EXACT France
CXP Group
SILOG
INCWO
VARIOPOSITIF
SYXPERIANE
VAISONET
VERYSWING
tout l'annuaire
 
TRIBUNE LIBRE
Une année importante pour l'automatisation des processus par la robotique
18/01/2020 L'automatisation des processus par la robotique, ou RPA, est la technologie qui va marquer l'année 2020. Grâce à la RPA, les processus et des tâches les plus ordinaires tels que le transfert des données d'un fichier à sa ...
Rich media, sécurité et digital : ce qui attend les entreprises en 2020
09/01/2020 Rich media : Au-delà des documents, l'utilisation des rich media. D'après l'adage, "une image vaut mieux que mille mots". Il n'y aura rien de plus vrai en cette nouvelle année. En effet, les contenus enrichis co ...
toutes les tribunes libres
 
 
FOCUS ENTREPRISE    
Salons Solutions
 
22, 23 & 24 septembre 2020 - Paris Porte de Versailles - Pavillon 3 EXPOSITION, CONFÉRENCES, ATELIERS ERP, CRM, BI, E-ACHATS, DEMATERIALISATION, ARCHIVAGE EN LIGNE, SDN/INFOTODOC Les prochains Salons Solutions vont regrouper 5 pôles thématique ...
fiche complète de l'entreprise
 
 
erp-infos.com - copyright groupe solutions 2024 - tous droits réservés
Articles
Interview de Florenc...
Focus sur l’étude « ...
Un clin d’œil à Beno...
ERP : les tendances ...
Salons Solutions 202...
Solutions Ressources...
Documation...
Dépêches
delaware France recr...
Le contenu de format...
Alten inaugure une n...
Cegid confirme sa pl...
Hitachi Solutions pr...
Le groupe Isatech ra...
Infor présente de no...
Communiqués de presse
71% des Directeurs A...
Comment les Services...
Esker automatise la ...
Esker/Grant Thornton...
Esker propose un nou...
Esker renforce son e...
Esker en position de...
Evénements
ESKER DIGITAL DAYS...
ESKER DIGITAL DAYS...
SALONS SOLUTIONS 202...
EUROBOIS...
SIANE 2019...
Salons Solutions Par...
Salons Solutions 201...
erp-infos.com
inscription newsletter
inscription annuaire
qui sommes-nous ?
contacts
publicité
tarifs & conditions
mentions légales
Les autres sites Infopro
E-learning-infos
ERP-infos
Intranet-infos
Eachats-infos
Phonethik