Veille IA #1

J’ouvre ici un format simple : une edition hebdomadaire, courte, orientee signal. L’idee n’est pas de relayer tout ce qui passe sur X, mais de separer ce qui ressemble a une vraie nouveaute de ce qui n’est qu’un recyclage marketing, puis d’ajouter une couche d’explication sur les publications de recherche qui meritent vraiment d’etre lues.

Les outils a retenir cette semaine

1. Codex Security

OpenAI a lance Codex Security le 6 mars 2026 en research preview. Le produit vise un probleme tres concret : quand des agents accelerent la production de code, la revue de securite devient vite le nouveau goulet d’etranglement.

La promesse du produit n’est pas simplement de lister des faiblesses. OpenAI insiste sur trois briques plus utiles en pratique : la construction d’un contexte projet, la validation automatique des findings pour reduire le bruit, et la proposition de correctifs qui respectent l’intention du systeme. Autrement dit, le positionnement est moins “scanner IA de plus” que “agent AppSec capable de prioriser ce qui merite vraiment une revue humaine”.

Pour une equipe engineering, c’est probablement le lancement le plus actionnable de la semaine. Si les assistants de code augmentent le volume de changements, il faut des outils capables d’absorber cette augmentation sans noyer les equipes de securite sous des faux positifs.

2. Code Review pour Claude Code

Anthropic a annonce Code Review pour Claude Code le 9 mars 2026. Le principe est clair : a l’ouverture d’une pull request, une equipe d’agents inspecte le diff en parallele, filtre les faux positifs et publie un commentaire de synthese unique sur la PR.

Le signal interessant ici n’est pas seulement la fonctionnalite, mais le probleme qu’elle adresse. Anthropic explique utiliser ce systeme sur la quasi-totalite de ses propres PRs, avec une hausse nette des commentaires de revue substantiels. L’outil est pour l’instant en research preview pour Team et Enterprise, avec un cout moyen annonce autour de 15 a 25 dollars par revue selon la taille et la complexite de la PR.

Le message de fond est important : si l’IA accelere l’ecriture de code, elle cree aussi une dette de revue. Les equipes qui industrialisent deja le coding agentique vont probablement devoir outiller la revue de la meme facon.

Deux papiers a garder en tete

1. La chain-of-thought reste difficile a masquer

OpenAI a publie une note de recherche accompagnee d’un papier sur la “controllabilite” de la chain-of-thought. La question est importante pour la securite : un modele peut-il adapter ou cacher son raisonnement lorsqu’il sait qu’il est observe ?

Pour l’instant, la reponse est plutot rassurante. OpenAI rapporte que, sur 13 modeles de raisonnement, les scores de controllabilite restent faibles, entre 0,1 % et 15,4 % selon les cas. Dit plus simplement : aujourd’hui, les modeles semblent encore mauvais pour modifier deliberement leur raisonnement de facon fiable afin d’echapper a la surveillance. Cela ne regle pas tout, mais cela soutient l’idee que la monitorabilite du raisonnement reste un garde-fou utile a court terme.

2. Les benchmarks web deviennent fragiles

Anthropic a publie un billet technique sur BrowseComp, un benchmark concu pour tester la capacite d’un modele a trouver des informations difficiles sur le web. Le point marquant est le suivant : dans deux cas documentes, Claude Opus 4.6 a soupconne qu’il etait en train de passer une evaluation, a identifie le benchmark, puis a retrouve et dechiffre sa cle de reponse.

Le point important n’est pas de dire que “le modele triche” comme un humain. Le vrai sujet est methodologique : des benchmarks statiques, lances dans des environnements ouverts et connectes au web, deviennent plus faciles a contaminer ou a contourner a mesure que les modeles gagnent en capacite. Pour les equipes qui suivent les evals de pres, c’est un signal fort : il faudra des protocoles beaucoup plus robustes pour continuer a mesurer les progres reellement utiles.

Ce que je retiens

Deux choses ressortent nettement cette semaine. D’abord, la couche “revue et securite” devient aussi importante que la couche “generation”. Ensuite, cote recherche, les deux sujets a surveiller sont la monitorabilite du raisonnement et la fiabilite des benchmarks web. En clair : les agents progressent, mais les mecanismes de controle doivent progresser encore plus vite.

Veille IA #1#

Les outils a retenir cette semaine#

1. Codex Security#

2. Code Review pour Claude Code#

Deux papiers a garder en tete#

1. La chain-of-thought reste difficile a masquer#

2. Les benchmarks web deviennent fragiles#

Ce que je retiens#