Approches : Prompt Engineering et Fine-Tuning
Joris Salmon
Nolwenn Chapellon
Année : 2024-2025 • Promotion Mars 2025
Comment générer des résumés rigoureux, synthétiques et exploitables du Journal Officiel, avec des modèles de langage légers ?
Corpus : articles du Journal Officiel (API Légifrance)
Modèles étudiants (SLM) :
Comparaison de deux approches :
Évaluation sur 20 extraits du JO :
Hyperparamètres FT : Batch 1, Acc. 64, LR 1e-4, 4-bit quant.
| Métrique | Précis (FT vs Base) | Neutre (FT vs Base) | Créatif (FT vs Base) |
|---|---|---|---|
| ROUGE-1 F1 | +16.17% ↑ | -10.10% ↓ | -11.32% ↓ |
| BERTScore F1 | +5.00% ↑ | -3.23% ↓ | -1.78% ↓ |
| Note Qualitative | 3.5/10 → 7.5/10 | Dégradé | Dégradé |
Fine-Tuning essentiel pour Phi-4, notamment pour le style 'Précis'.
Dégradation notable des autres styles sans fine-tuning.
| Métrique | Précis (FT vs Base) | Neutre (FT vs Base) | Créatif (FT vs Base) |
|---|---|---|---|
| ROUGE-1 F1 | +2.41% ↑ | -3.98% ↓ | +0.71% ↑ |
| BERTScore F1 | +0.27% ↑ | -1.72% ↓ | +0.16% ↑ |
| Note Qualitative | 8/10 → 7.5/10 | Dégradé | Amélioration vs GPT-4 |
Mistral : très performant de base pour le résumé juridique.
Fine-Tuning : valeur ajoutée limitée, améliore le style 'Créatif'.
| Métrique | Précis (FT vs Base) | Neutre (FT vs Base) | Créatif (FT vs Base) |
|---|---|---|---|
| ROUGE-1 F1 | -11.38% ↓ | -19.91% ↓ | +13.56% ↑ |
| BERTScore F1 | -1.89% ↓ | -9.88% ↓ | +1.79% ↑ |
| Note Qualitative | Dégradé | Dégradé | 5/10 → 6/10 |
Pour Qwen, le Fine-Tuning est nécessaire.
Amélioration modeste, bénéficie principalement au style 'Créatif'.
| Modèle | Style | ROUGE-1 Gain (%) | BERTScore Gain (%) | Note Quali. (Base → FT) |
|---|---|---|---|---|
| Phi-4-mini | Précis | +16.17 | +5.00 | 3.5/10 → 7.5/10 |
| Mistral-7B | Précis | +2.41 | +0.27 | 8/10 → 7.5/10 |
| Qwen2-1.5B | Créatif | +13.56 | +1.79 | 5/10 → 6/10 |
Le graphique et le tableau montrent l'impact variable du Fine-Tuning.
Gains significatifs pour Phi-4 et Qwen sur leurs styles optimaux.
Mistral conserve son excellence intrinsèque.
Observation majeure : Le Fine-Tuning améliore significativement la cohérence et la précision, mais l'efficacité varie selon l'architecture du modèle et le corpus d'entraînement.
Vision long terme : Développement d'un assistant IA spécialisé dans l'analyse et la synthèse de documents legislatifs, accessible aux professionnels du droit et du journalisme.
Oui, les SLM peuvent résumer le Journal Officiel de manière rigoureuse et utile !
Merci de votre attention !
Joris Salmon
Étudiant Master 2 Data AnalyticsNolwenn Chapellon
Étudiante Master 2 Data Analytics