Titre : | Une méthode hybride pour le couplage d’enregistrements |
Auteurs : | Benyahia Miloud, Directeur de thèse ; AMARI chaimaà, Auteur |
Type de document : | texte imprimé |
Editeur : | univ DR taher moulay saida, 2024 |
Format : | 58 p. / ill;fig; / 29cm. |
Langues: | Français |
Catégories : | |
Mots-clés: | Une méthode ; hybride ; pour le couplage ; d’enregistrements |
Résumé : |
Chaque année, les entreprises du monde entier subissent des pertes
considérables en raison de défauts de qualité des données. Les parties prenantes sont de plus en plus conscientes de l’importance de la qualité des données. Des sommes importantes sont allouées pour améliorer la qualité des données stockées. L'un des processus clés dans le domaine de la qualité des données est l'appariement des enregistrements (RL). RL (également connu sous le nom de réconciliation d'entités) est le processus de détection des doublons faisant référence à la même entité réelle dans un ou plusieurs ensembles de données. L'une des étapes les plus cruciales du processus RL est la segmentation, qui réduit la complexité exponentielle du processus en divisant les données en un ensemble de blocs. De cette façon, la correspondance n’est effectuée qu’entre les enregistrements du même bloc. Cependant, choisir les meilleures clés de segmentation pour diviser les données est une tâche ardue et, dans la plupart des cas, elle est effectuée par un expert du domaine. Plusieurs approches ont été proposées dans la littérature pour la sélection automatique des clés de segmentation, mais la plupart reposent sur l’existence de données de référence, ce qui n’est pas le cas des jeux de données réels. Dans cet article, nous proposons une nouvelle approche non supervisée pour la sélection automatique des clés de segmentation. Cette approche est basée sur les algorithmes récemment proposés Grey Wolf Optimizer (GWO) et Bald EagleSearch (BES), où nous traitons le problème comme un cas de sélection de fonctionnalités. Les résultats obtenus à partir d'expériences sur des ensembles de données du monde réel ont démontré l'efficacité de notre proposition dans laquelle GWO a surpassé les approches existantes de sélection de caractéristiques dans la littérature et a renvoyé les meilleures clés de segmentation. MOTS CLÉS: Record linkage,clés de blocage,blocage,Matching,sélection des attributes, BES, GWO. |
Note de contenu : |
Chapitre01:Qualité des Données
Chapitre02:Le couplage d’enregistrement Chapitre03:Implémentation et Expérimentation Conclusion. |
Exemplaires
Code-barres | Cote | Support | Localisation | Section | Disponibilité |
---|---|---|---|---|---|
aucun exemplaire |
Documents numériques (1)
Une méthode hybride pour le couplage d’enregistrements Adobe Acrobat PDF |