| Titre : | Plateforme intelligente de santé basée sur le Machine Learning |
| Auteurs : | Lakhdari Fatima Zohra, Auteur ; Zahaf Ahmed, Directeur de thèse |
| Type de document : | texte manuscrit |
| Editeur : | [S.l.] : [S.l.] : [S.l.] : Université Saïda – Dr. Tahar Moulay – Faculté des Mathématiques, de l’Informatique et de Télécommunications, 2025/2026 |
| Format : | 96ص |
| Accompagnement : | CD |
| Langues: | Français |
| Index. décimale : | BUC-M 008532 |
| Catégories : | |
| Résumé : |
est sur ces bases assainies que nous avons retenu le modèle Ensemble
Learning (XGBoost + LightGBM + Random Forest), qui atteint une exactitude de 90,61 % et une AUC-ROC de 0,8500 sur un ensemble de test fidèle à la distribution réelle de la maladie. Ce choix ne repose pas seulement sur les chiffres : il tient compte de la fiabilité clinique, de la capacité à ajuster le seuil de décision selon le contexte, de l'interprétabilité via SHAP, et d'une inférence quasi instantanée compatible avec un usage en temps réel. Ce modèle a ensuite été intégré au sein d'une plateforme complète et fonctionnelle, bâtie sur une architecture full-stack moderne adossée à Supabase. MED AI propose aujourd'hui un assistant de diagnostic pour le patient comme pour le médecin, un système de recommandation et de prise de rendez-vous, une messagerie et une gestion sécurisée des dossiers, le tout protégé par une authentification robuste et des politiques d'accès au niveau des données. Ce travail n'est évidemment pas exempt de limites, qui dessinent autant de pistes pour l'avenir. Le recall sur la classe positive reste perfectible, ce qui invite à explorer des stratégies plus fines de gestion du déséquilibre et d'ajustement du seuil. L'extension multimodale, envisagée dès l'état de l'art, ouvrirait la voie à l'intégration directe du signal ECG aux côtés des données structurées. Enfin, une validation clinique en conditions réelles, menée en collaboration avec des praticiens, constituerait l'étape décisive vers un déploiement à grande échelle. En définitive, ce mémoire illustre qu'une démarche alliant rigueur méthodologique et souci d'utilité concrète peut donner naissance à un outil à la fois crédible scientifiquement et porteur de sens sur le plan humain. Face à une maladie qui demeure la première cause de mortalité dans le monde, contribuer, même modestement, à un diagnostic plus précoce et plus accessible nous semble être un objectif qui en valait pleinement la peine. |
| Note de contenu : |
Table des matières
Introduction générale ..................................................................................................................... 11 Problématique ................................................................................................................................. 13 I. CHAPITRE I: Intelligence Artificielle, Apprentissage Automatique et Architectures Neuronales Modernes ..................................................................................................................... 16 1. Introduction :............................................................................................................................... 16 2. Intelligence Artificielle (IA) : ...................................................................................................... 16 2.1 Définition et historique .......................................................................................................... 16 2.2 Catégories d'IA...................................................................................................................... 17 2.3 IA Symbolique vs IA Connexionniste.................................................................................... 17 3. Machine Learning (Apprentissage Automatique) ...................................................................... 17 3.1 Définition ............................................................................................................................... 17 3.2 Types d'apprentissage ........................................................................................................... 18 a) Apprentissage supervisé ...................................................................................................... 18 b) Apprentissage non supervisé............................................................................................... 18 c) Apprentissage par renforcement ......................................................................................... 18 3.3 Concepts fondamentaux ........................................................................................................ 18 4. Deep Learning (Apprentissage Profond) .................................................................................... 19 4.1 Définition et motivations ....................................................................................................... 19 4.2 Architecture d'un réseau profond ......................................................................................... 19 4.3 Rétropropagation et descente de gradient ............................................................................ 20 4.4 Principales architectures ....................................................................................................... 20 5. Réseau de Neurones Convolutif 1D (CNN-1D) ........................................................................... 21 5.1 Principe de la convolution 1D ............................................................................................... 21 5.2 Architecture typique .............................................................................................................. 21 5.3 Avantages sur les données séquentielles ................................................................................ 22 5.4 Domaines d'application ......................................................................................................... 22 6. Architecture Transformer : ......................................................................................................... 23 6.1 Contexte et motivation : ........................................................................................................ 23 6.2 Mécanisme d'attention (Self-Attention) :.............................................................................. 23 6.3 Architecture complète : ......................................................................................................... 23 6.4 Variantes majeures : .............................................................................................................. 24 7. Grands Modèles de Langage (LLM) .......................................................................................... 25 7.1 Définition ................................................................................................................................... 25 7.2 Pré-entraînement et fine-tuning ............................................................................................ 25 Table des matiéres 7 Pré-entraînement .................................................................................................................. 25 Fine-tuning et RLHF ............................................................................................................. 25 7.3 Capacités émergentes ............................................................................................................ 26 7.4 Principaux LLM .................................................................................................................... 26 7.5 Limitations............................................................................................................................. 26 8. LLM Multimodal ........................................................................................................................ 27 8.1 Définition ............................................................................................................................... 27 8.2 Architectures de fusion multimodale .................................................................................... 27 a) Fusion précoce (Early Fusion) ............................................................................................ 27 b) Fusion par attention croisée (Cross-Attention Fusion) ...................................................... 27 8.3 Modalités supportées ............................................................................................................. 27 8.4 Principaux LLM multimodaux ............................................................................................. 28 8.5 Défis spécifiques .................................................................................................................... 28 9. Tableau comparatif des principaux LLMs généraux ............................................................. 29 10. Synthèse Comparative : ..................................................................................................... 30 11. Conclusion du Chapitre : ................................................................................................... 30 II. CHAPITRE II: Cadre Théorique et État de l'Art ............................................................. 34 1. Introduction : .......................................................................................................................... 34 2. Problématique du diagnostic des maladies cardiaques .............................................................. 35 2.1. Définition des maladies cardiovasculaires ........................................................................... 35 2.2.Facteurs de risque ................................................................................................................. 35 2.3. Limites du diagnostic clinique traditionnel ......................................................................... 36 3. Travaux basés sur le Machine Learning classique ..................................................................... 37 3.1. Random Forest (RF)............................................................................................................. 37 3.2. XGBoost (Extreme Gradient Boosting) ............................................................................... 38 3.3. LightGBM (Light Gradient Boosting Machine) .................................................................. 38 3.4. Support Vector Machine (SVM) .......................................................................................... 39 3.5. Réseaux de neurones artificiels (ANN) et Deep Learning ................................................... 39 3.6. Approches ensemblistes et hybrides ..................................................................................... 40 3.7. Tableau comparatif des travaux ML ................................................................................... 40 4. Travaux basés sur les LLMs et MMLLMs : ............................................................................... 42 4.1. Introduction aux LLMs médicaux : ..................................................................................... 42 4.2. BioClinicalBERT et ClinicalBERT : .................................................................................... 42 4.3. BioBERT et autres BERT médicaux : .................................................................................. 43 4.4. Med-PaLM et Med-PaLM 2 : .............................................................................................. 43 4.5. GPT-4 et applications cardiovasculaires :............................................................................ 44 Table des matiéres 8 4.6. Qwen et autres LLMs open-source : .................................................................................... 45 4.8. Tableau comparatif des LLMs / MMLLMs :....................................................................... 45 5. Conclusion du chapitre ............................................................................................................... 46 III .CHAPITRE III : Conception, expérimentation et choix du modèle ....................................... 49 1. Introduction ................................................................................................................................ 49 2. Jeu de données et prétraitement ................................................................................................. 49 2.1. Description du dataset .......................................................................................................... 49 2.2. Pipeline de prétraitement ..................................................................................................... 50 3. Analyse critique : importance de l'ordre des étapes et problème de data leakage .................... 51 3.1. Le problème du pipeline incorrect ....................................................................................... 51 3.2. Comparaison empirique des deux pipelines ........................................................................ 52 3.3. Pourquoi SMOTE est néanmoins indispensable sur ce dataset .......................................... 53 4. Modèles entraînés et évalués ....................................................................................................... 54 4.1. XGBoost (Extreme Gradient Boosting) ............................................................................... 54 4.2. LightGBM (Light Gradient Boosting Machine) .................................................................. 54 4.3. Ensemble Learning (Voting Soft : XGBoost + LightGBM + Random Forest) ................... 55 4.4. CNN (Convolutional Neural Network) ................................................................................ 55 4.5. Bio_ClinicalBERT (LLM médical fine-tuné) ....................................................................... 56 4.6. Qwen 2.5-1.5B-Instruct (LLM généraliste, zero-shot) ........................................................ 56 5. Tableau comparatif des modèles testés (pipeline correct) .......................................................... 57 3.6. Choix du modèle final : Ensemble Learning ........................................................................... 58 6.1. Justification des performances ............................................................................................. 58 6.2. Justification dans le contexte médical .................................................................................. 59 6.3. Interprétabilité et déployabilité ........................................................................................... 59 7. Études antérieures sur des datasets similaires ........................................................................... 59 7.1. Yang et al. (2025) — LightGBM interprétable sur BRFSS_2015 ........................................ 59 7.2. Chowdhury (2025) — XGBoost sur BRFSS pour patients diabétiques .............................. 60 7.3. Tompra et al. (2024) — CatBoost + SMOTE-ENN sur BRFSS 2021 .................................. 60 7.4. Wang et al. (2023) — Indicateurs et prédictions de maladie cardiaque.............................. 60 7.5. Stacking ensemble pour CHD (2025) ................................................................................... 60 7.6. Awosika et al. (2025) — Comparaison multi-modèles avec SMOTE .................................. 60 8. Comparaison de notre solution avec les travaux antérieurs .................................................. 61 3.8.1. Points forts de notre solution............................................................................................. 61 9. Conclusion du chapitre ............................................................................................................... 62 IV .CHAPITRE IV : Implémentation de la plateforme MED AI .................................................. 66 1. Introduction : .............................................................................................................................. 66 Table des matiéres 9 2 . Environnement de développement et outils ............................................................................... 66 3 . Conception de la base de données (Supabase) ........................................................................... 67 3.1 Schéma global de la base de données ................................................................................... 67 3.2 Description des principales tables ........................................................................................ 68 a) Gestion des utilisateurs et des rôles .................................................................................... 68 b) Patients et module de diagnostic par IA ............................................................................. 69 c) Rendez-vous, messagerie et notifications ............................................................................ 69 3.3 Relations entre les tables ...................................................................................................... 70 4 . Présentation des interfaces de l'application .............................................................................. 71 4.1 Authentification et création de compte ................................................................................ 71 4.2 Espace Patient — Assistant IA Cardiaque .......................................................................... 73 4.3 Recherche de médecin et prise de rendez-vous .................................................................... 76 4.4 Espace Médecin — Assistant au diagnostic ......................................................................... 79 5 . Sécurité et confidentialité des données ..................................................................................... 83 6 . Conclusion du chapitre .............................................................................................................. 83 Conclusion générale : ...................................................................................................................... 85 Références ........................................................................................................................................ 87 |
Exemplaires
| Code-barres | Cote | Support | Localisation | Section | Disponibilité |
|---|---|---|---|---|---|
| aucun exemplaire |
Documents numériques (1)
BUC-M 008532 Adobe Acrobat PDF |

