En naviguant sur notre site vous acceptez l'installation et l'utilisation des cookies sur votre ordinateur. En savoir +

Menu Logo Principal AgroParisTech

MIA Paris

Soutenance de thèse de Joe Raad

vendredi 30 novembre 2018 après midi - Amphi Coléou à AgroParisTech, 16 rue Claude Bernard à Paris

Gestion d'identité dans des graphes de connaissances

La soutenance de ma  thèse aura lieu le vendredi 30 novembre à AgroParisTech (amphi Coléou).

Titre : Gestion d'identité dans des graphes de connaissances

Résumé : En l'absence d'une autorité de nommage centrale sur le Web de données, il est fréquent que différents graphes de connaissances utilisent des noms (IRIs) différents pour référer à la même entité. Chaque fois que plusieurs noms sont utilisés pour désigner la même entité, les faits owl:sameAs sont nécessaires pour déclarer des liens d’identité et améliorer l’exploitation des données disponibles. De telles déclarations d'identité ont une sémantique logique stricte, indiquant que chaque propriété affirmée à un nom sera également déduite à l'autre et vice versa. Bien que ces inférences puissent être extrêmement utiles pour améliorer les systèmes fondés sur les connaissances tels que les moteurs de recherche et les systèmes de recommandation, l'utilisation incorrecte de l'identité peut avoir des effets négatifs importants dans un espace de connaissances global comme le Web de données. En effet, plusieurs études ont montré que owl:sameAs est parfois incorrectement utilisé sur le Web des données. Cette thèse étudie le problème de liens d’identité erronés ou inappropriés qui sont exprimés par des liens owl:sameAs et propose des solutions différentes mais complémentaires. Premièrement, elle présente une ressource contenant la plus grande collection de liens d’identité collectés du LOD Cloud, avec un service Web à partir duquel les données et leur clôture transitive peuvent être interrogées. Une telle ressource a à la fois des impacts pratiques (elle aide les utilisateurs à trouver différents noms pour la même entité), ainsi qu'une valeur analytique (elle révèle des aspects importants de la connectivité du LOD Cloud). En outre, en s’appuyant sur cette collection de 558 millions liens d’identité, nous montrons comment des mesures de réseau telles que la structure de communauté du réseau owl:sameAs peuvent être utilisées afin de détecter des liens d’identité éventuellement erronées. Pour cela, nous attribuons un degré d'erreur pour chaque lien owl:sameAs en fonction de la densité de la ou des communautés dans lesquelles elles se produisent et de leurs caractéristiques symétriques. L'un des avantages de cette approche est qu'elle ne repose sur aucune connaissance supplémentaire. Finalement, afin de limiter l'utilisation excessive et incorrecte du owl:sameAs, nous définissons une nouvelle relation pour représenter l'identité de deux instances d’une classe dans un contexte spécifique (une sous-partie de l’ontologie). Cette relation d'identité s'accompagne d'une approche permettant de détecter automatiquement ces liens, avec la possibilité d'utiliser certaines contraintes expertes pour filtrer des contextes non pertinents. La détection et l’exploitation des liens d’identité contextuels détectés sont effectuées sur deux graphes de connaissances pour les sciences de la vie, construits en collaboration avec des experts du domaine de l’institut national de la recherche agronomique (INRA).

Jury : 

Mme Catherine Faron Zucker -- Maître de Conférences HDR, Université Nice Sophia Antipolis

Rapporteur

M. Mathieu d’Aquin -- Professeur, National University of Ireland Galway

Rapporteur

M. Harry Halpin -- Chercheur, Massachusetts Institute of Technology 

Examinateur

M. Pascal Molli -- Professeur, Université de Nantes

Examinateur

Mme Sarah Cohen Boulakia -- Professeure, Université Paris-Sud

Examinatrice

Mme Juliette Dibie -- Professeure, AgroParisTech

Co-Directrice de thèse

Mme Nathalie Pernelle -- Maître de Conférences HDR, Université Paris-Sud

Co-Directrice de thèse

Mme Fatiha Saïs -- Maître de Conférences, Université Paris-Sud

Invitée

Mme Liliana Ibanescu -- Maître de Conférences, AgroParisTech 

Invitée