Titre : | La sélection semi-automatique des attributs lors de la mise en correspondance (Matching) pour le couplage d'enregistrements. |
Auteurs : | Benyahia Miloud, Directeur de thèse ; Souilem Abdelkrim, Auteur ; Baali Bendjelloul, Auteur |
Type de document : | texte imprimé |
Editeur : | univ DR taher moulay saida, 2022-2023 |
ISBN/ISSN/EAN : | TECT03064 |
Format : | 58p / ill / 29cm |
Langues: | Français |
Mots-clés: | Qualité des données, couplage d’enregistrement, L’algorithme K-Modes, Blo- cage, Clé de blocage. |
Résumé : |
Le couplage d’enregistrement également appelée Record Linkage (RL) est un enjeu
important pour la qualité de données. C’est le processus qui vise à détecter tous les enregis- trements qui font référence à la même entité du monde réel, puis à les fusionner en un seul tuple. Afin de réduire le nombre important de comparaisons, la technique de blocage (Blocking) consiste à créer un ensemble de blocs qui partagent une valeur commune nommée valeur de clé de blocage (Bloking Key Value) BKV. Sur la base des défis de RL Nous avons adapté l’algorithme K-Modes comme étape de blo- cage dont le but est d’améliorer le temps d’exécution et de contrôler le nombre de bloc et le nombre de données par bloc. La méthode proposée a montré que la sélection des attributs pertinents lors de génération des clés de blocage a prouvé son influence sur la qualité de données obtenues. Les caractéristiques d’attributs qui affectent la décision de sélection comprennent le niveau d’erreurs dans les valeurs d’attribut et le nombre (et la distribution) des valeurs d’attribut, c’est-à-dire le contenu informationnel de l’attribut. |
Note de contenu : |
-La qualité des données
-Couplage d’enregistrements -Implémentation et Expérimentation |
Exemplaires
Code-barres | Cote | Support | Localisation | Section | Disponibilité |
---|---|---|---|---|---|
aucun exemplaire |
Documents numériques (1)
La sélection semi-automatique des attributs lors de la mise en correspondance Adobe Acrobat PDF |