
Partie 10 · Quand ça coince
Pourquoi Claude oublie ta conversation et comment garder le contexte
Tu comprendras la limite technique qui fait oublier Claude et tu connaîtras 4 stratégies pour garder ton contexte intact même sur de longues sessions.
Tu as parfois cette frustration quand tu utilises Claude : tu lui as expliqué quelque chose au début de la conversation, et 30 messages plus tard, il semble avoir oublié cette information importante.
Ce n'est pas un bug, c'est une limite technique fondamentale de toutes les IA actuelles.
Tu apprendras dans ce guide pourquoi ce phénomène se produit et quelles 4 stratégies appliquer pour garder ton contexte intact même sur de très longues sessions.
En 9 minutes de lecture, tu connaîtras la mécanique de la mémoire de travail, le concept de fenêtre de contexte, et les astuces concrètes pour ne plus jamais perdre une information importante dans une conversation.
Ce guide s'adresse à toute personne qui utilise Claude régulièrement et qui veut éviter les frustrations. Tu lis le chapitre 55 d'un manuel complet de 67 chapitres disponible sur claude-pour-les-debutants.fr.
Ce que TU fais dans ce guide tient en 1 action : tu adoptes les 4 stratégies décrites ci-dessous dans tes prochaines conversations.
Ce que Claude fait : il garde tout le contexte qui tient dans sa fenêtre, et il oublie silencieusement ce qui dépasse, sans toujours te prévenir.
La fenêtre de contexte expliquée simplement
Anthropic appelle ça la "Working Memory" (mémoire de travail) dans son cours public.
Tu peux imaginer Claude comme une personne qui regarde un grand tableau blanc. Sur ce tableau, il peut écrire ce que tu lui dis et ce qu'il te répond.
La mémoire de Claude pour cette conversation, c'est exactement ce qui est écrit sur le tableau.
Mais ce tableau a une taille fixe. Pour Claude Opus 4.8, il peut contenir environ 1 million de tokens, ce qui équivaut à plusieurs centaines de milliers de mots.
C'est énorme : tu peux y coller un livre entier. Mais c'est quand même fini.
→ Quand le tableau est plein, soit Claude refuse d'accepter de nouveaux messages, soit il efface silencieusement les parties les plus anciennes pour faire de la place. C'est ce silence qui est trompeur : tu crois qu'il "oublie", alors qu'en réalité l'information n'est tout simplement plus disponible.

Ce qui occupe ta fenêtre de contexte
Chaque élément de ta conversation prend de la place dans la fenêtre.
D'abord, tu vois que tous tes messages depuis le début de la conversation comptent. Ensuite, tu observes que toutes les réponses de Claude pèsent aussi sur la fenêtre.
Ensuite, tu retrouves les fichiers que tu as téléversés (PDF, images, documents) qui sont convertis en tokens et occupent une grosse partie de la place.
Enfin, tu y trouves aussi les instructions de système, les paramètres de ton compte, et les informations de contexte technique qui consomment quelques tokens.
Un PDF de 100 pages peut facilement consommer 50 000 tokens à lui seul. Une image complexe en haute résolution peut consommer 1 500 à 3 000 tokens.
Une longue conversation de 60 échanges peut atteindre 30 000 à 50 000 tokens.
▸ Tu vois que même la fenêtre énorme de 1 million de tokens d'Opus 4.8 peut se remplir si tu enchaînes les très longues conversations avec beaucoup de fichiers.

Le piège du "lost in the middle"
La fenêtre de contexte a aussi un effet secondaire que les chercheurs appellent "lost in the middle" (perdu au milieu).
Anthropic le documente dans son cours AI Capabilities : quand tu places une information cruciale au milieu d'un très long document, Claude a plus de mal à la retrouver que si tu l'avais placée au tout début ou à la toute fin.
C'est un comportement observé sur tous les grands modèles d'IA, pas seulement Claude.
Concrètement, si tu colles un PDF de 200 pages et que tu poses une question dont la réponse est cachée en page 95, Claude peut louper l'information alors qu'il la trouverait facilement si elle était en page 1 ou en page 200.
→ Tu retiens : la position du contexte dans la fenêtre compte autant que sa présence.

Stratégie 1 : front-loader le contexte important
"Front-loader" veut dire placer tout en haut, dès le début de ta question, les informations critiques.
Tu structures tes prompts longs en mettant d'abord les contraintes absolues (ton, format, ce qu'il ne doit pas faire), ensuite le contexte (qui tu es, ce que tu veux), enfin la demande.
Cette structure évite que Claude oublie une contrainte en cours de réponse parce qu'elle était noyée dans un long bloc.
Tu peux t'appuyer sur le modèle qui suit pour structurer ton prompt complexe.
CONTRAINTES (à respecter absolument) :
- Ne jamais utiliser de langage technique
- Maximum 300 mots
- Format : 3 paragraphes courts
CONTEXTE :
Je suis [ta situation], je travaille avec [ton public].
DEMANDE :
[Ta question précise]
▸ Tu places les contraintes en premier parce que ce sont les éléments les plus importants à respecter. Claude les retient mieux quand elles sont visibles dès l'ouverture.
Stratégie 2 : redonner le contexte régulièrement
Dans une longue conversation, tu rappelles toi-même le contexte clé toutes les 10 à 15 échanges.
Tu peux le faire en début de message avec une formule comme "Rappel du contexte : je suis [X], je travaille sur [Y], voici où on en est sur ma demande [Z]". Cette redite prend 30 secondes à écrire et garantit que Claude a le contexte frais en mémoire pour ta question suivante.
Cette stratégie consomme un peu plus de tokens, mais évite les erreurs frustrantes où Claude répond à côté parce qu'il a perdu un détail important.
↳ Tu peux aussi demander à Claude lui-même de te résumer ce qu'il sait du contexte : "Avant de répondre, résume-moi en 3 lignes ce que tu sais sur ma situation". Si son résumé est faux ou incomplet, tu corriges immédiatement avant qu'il parte sur la mauvaise piste.
Stratégie 3 : ouvrir une nouvelle conversation pour changer de sujet
Plutôt que d'enchaîner les sujets dans une seule longue conversation, tu en ouvres une nouvelle pour chaque sujet majeur.
Cette habitude a 2 avantages. D'abord, la nouvelle conversation démarre avec une fenêtre vide, donc tu as toute la place pour le nouveau sujet. Ensuite, Claude n'est pas distrait par les échanges précédents qui n'ont rien à voir avec ta nouvelle question.
Tu peux quand même transférer le contexte utile entre les 2 conversations. Tu copies la dernière réponse pertinente de Claude, ou tu rédiges un résumé en 5 lignes, et tu colles ça en premier message de la nouvelle conversation.
→ Tu retiens : une conversation = un sujet majeur. Pas 5 sujets différents qui s'accumulent.
Stratégie 4 : utiliser les Projets pour les sujets récurrents
Si tu reviens souvent sur le même sujet (par exemple un projet professionnel en cours, un domaine de connaissance que tu approfondis), tu crées un Projet dans claude.ai.
Un Projet contient des instructions personnalisées que Claude voit au début de chaque nouvelle conversation dans ce Projet. Tu y mets ton contexte de base (qui tu es, ce que tu fais, tes préférences, les contraintes récurrentes). À chaque nouvelle conversation, Claude démarre avec ce contexte sans que tu aies à le retaper.
Tu peux aussi téléverser dans le Projet des documents de référence (jusqu'à 100 000 lignes de code par exemple sur Claude Enterprise). Claude peut alors interroger ces documents à chaque nouvelle question, sans que tu aies à les re-coller.
▸ Tu peux utiliser cette fonctionnalité sur les plans Pro, Max, Team et Enterprise. Le plan Free ne donne pas accès aux Projets pour l'instant.
La fonction Memory pour la mémoire entre conversations
Au-delà des Projets, Anthropic a déployé en octobre 2025 une fonctionnalité Memory qui permet à Claude de se souvenir d'informations entre tes différents chats.
Cette mémoire fonctionne sur les plans Team et Enterprise depuis le lancement, et est en cours de déploiement sur Pro et Max depuis fin octobre 2025. Une fois activée, Claude retient automatiquement les informations importantes que tu lui as données (ton métier, tes préférences, tes projets en cours).
Tu peux consulter à tout moment ce que Claude a retenu en allant dans Settings > Memory. Tu peux supprimer un souvenir précis ou vider toute la mémoire si tu veux repartir à zéro.
↳ Cette fonctionnalité est différente de la mémoire de travail (la fenêtre de contexte d'une conversation unique). Tu utilises Memory pour garder des informations utiles à long terme. Tu utilises la fenêtre de contexte pour gérer le détail de la conversation en cours.
Comment détecter que Claude a oublié
Plusieurs signaux te montrent que Claude a perdu un élément de contexte.
Premier signal : il te demande une information que tu lui as déjà donnée. Par exemple "Pour quel type d'entreprise est-ce ?" alors que tu l'as déjà précisé 20 messages plus tôt.
Deuxième signal : sa réponse contredit quelque chose que tu avais convenu plus tôt. Il propose une solution X alors que vous étiez d'accord que X ne convient pas pour ta situation.
Troisième signal : son ton change brusquement, il devient plus générique. Il répond comme à un inconnu alors que vous aviez une conversation construite avec ton contexte précis.
▸ Quand tu détectes un de ces signaux, tu rappelles immédiatement le contexte clé en quelques lignes avant ta question suivante.
Un dernier mot
Claude ne fait pas exprès d'oublier : c'est une contrainte technique de la mémoire de travail.
Avec les 4 stratégies de ce guide (front-loader, redonner le contexte, ouvrir une nouvelle conversation, utiliser les Projets), tu garderas le contrôle même sur tes plus longues sessions.
Tu peux ajouter une couche supplémentaire avec la fonction Memory si tu utilises les plans Pro, Max, Team ou Enterprise.
Le chapitre suivant t'apprendra à vérifier que ce que Claude affirme est vrai, pour ne pas tomber dans le piège des hallucinations factuelles.

→ Essaie Claude maintenant : claude.ai
→ Chapitre suivant : Vérifier ce que Claude dit
Ce chapitre t'a aidé ?
Sois le premier à donner ton avis.