Une semaine de mégaphone côté plateformes
Hebdo numéro 3 de la série, et la semaine du 11 au 22 mai a été dominée par les annonces de plateforme. Google a déballé toute sa quincaillerie à I/O — trois nouveaux modèles Gemini, un agent général, un générateur vidéo. OpenAI a lancé sa filiale de déploiement enterprise, avec une acquisition londonienne de 150 ingénieurs à la clé. Anthropic a signé deux deals majeurs : 200 millions avec la fondation Gates sur quatre ans, et l'extension de son alliance avec PwC une semaine après celle d'OpenAI. Et Mira Murati a sorti son premier modèle chez Thinking Machines.
J'ai fait le tri. Pas de hype, pas de récap des 25 startups qui ont levé 5 millions chacune. Voici les annonces qui changent réellement quelque chose à votre stack et à vos arbitrages cette semaine.
Les actus majeures de la semaine
OpenAI lance la Deployment Company et acquiert Tomoro — 12 mai : OpenAI ouvre une filiale dédiée au déploiement enterprise, capitalisée à 4 milliards de dollars, en achetant au passage Tomoro — un cabinet de conseil IA basé à Londres qui apporte 150 Forward Deployed Engineers à temps plein. Le modèle est calqué sur celui de Palantir : on n'envoie pas des slides, on envoie des ingénieurs qui s'assoient en interne et construisent le système pendant des mois. Tomoro a fait ses preuves chez Fidelity International, Virgin Atlantic, Tesco, la NBA et Supercell — où ils ont livré un agent de support in-game pour 110 millions de joueurs en 12 semaines. Le signal pour vous : Accenture, Deloitte et Capgemini viennent de prendre un coup. Si vous êtes en cabinet conseil traditionnel et que vous vendez de l'intégration IA aux Fortune 500, la concurrence vient désormais directement du fournisseur du modèle, avec des marges qu'aucun consultant ne peut tenir.
Anthropic et la fondation Gates : 200 millions sur 4 ans — 14 mai : Anthropic signe son plus gros engagement philanthropique : 200 millions de dollars en grants, crédits Claude et support technique étalés sur quatre ans, dédiés à la santé globale, l'éducation, les sciences du vivant et la mobilité économique. Premier focus côté santé : la polio, le HPV et l'éclampsie/prééclampsie dans les pays à revenu faible et intermédiaire. Côté éducation, Anthropic et Gates co-développent des outils pour tutorat maths, conseil universitaire et conception de curriculum aux États-Unis, en Afrique subsaharienne et en Inde. C'est la première fois qu'un labo frontière met autant d'argent sur la table pour des cas d'usage non-monétisables. Le sous-texte stratégique : Anthropic se positionne comme l'acteur sérieux et responsable face à OpenAI sur les marchés régaliens et publics — un terrain où la confiance des États pèse plus que les benchmarks.
PwC étend son alliance avec Anthropic — 30 000 personnes formées sur Claude — 14 mai : Et voilà le rebondissement. Une semaine après l'annonce OpenAI × PwC sur la fonction finance, PwC double la mise avec Anthropic : Claude Code et Cowork déployés sur 300 000 collaborateurs, 30 000 certifiés Claude, et un Center of Excellence conjoint. Premier business unit anchored sur Anthropic : l'Office of the CFO. Les chiffres sortent du terrain : l'underwriting assurance passe de 10 semaines à 10 jours, des tâches de sécu de plusieurs heures à quelques minutes, et les clients reportent jusqu'à 70% d'amélioration en délai de livraison. Le take : PwC ne choisit pas son camp, il bench-marque les deux fournisseurs en interne pour arbitrer côté client selon l'usage. C'est le pattern que tous les Big 4 vont adopter. Si vous êtes en B2B SaaS et que vous mettez tous vos œufs chez un seul provider, regardez ce que fait PwC et copiez-le.
Google I/O 2026 : trois nouveaux modèles Gemini d'un coup — 19 mai : Google déballe tout. Gemini 3.5 Flash devient le défaut dans l'app Gemini et dans AI Mode de Search à l'échelle mondiale, avec une vitesse 4 fois supérieure à la 3.1 Flash pour un prix qui descend autour d'un tiers des modèles frontière comparables. Gemini Spark, un agent proactif disponible en beta pour les abonnés Google AI Ultra à 250 dollars par mois, qui exécute des tâches en arrière-plan à travers Gmail, Calendar, Docs et Drive sans qu'on lui demande à chaque étape. Et Gemini Omni, un modèle vidéo cinématique qui génère, remixe et édite à partir de prompts texte, images ou clips existants. La stratégie est limpide : Google capitalise sur sa distribution Search/Gmail/Android pour faire payer la quatrième fois les mêmes utilisateurs qu'OpenAI et Anthropic. À 250 dollars par mois, AI Ultra devient plus cher que ChatGPT Pro et Claude Max combinés.
Thinking Machines lance ses Interaction Models — 11 mai : Première sortie publique de Mira Murati depuis qu'elle a levé 2 milliards à 12 de valo l'an dernier. TML-Interaction-Small est un MoE de 276 milliards de paramètres totaux et 12 milliards actifs, entraîné from scratch pour faire du full-duplex — il écoute et parle en même temps, comme un humain au téléphone, avec un temps de réponse de 0,40 seconde. La différence avec les modèles voix d'OpenAI ou Google : ce n'est pas un harness branché sur un LLM séquentiel, c'est une architecture native temps réel. Disponible en preview limitée. Si vous bossez sur des assistants vocaux, du support client live ou des interfaces conversationnelles, c'est la première démo crédible d'un truc qui pourrait remplacer le combo OpenAI Realtime plus post-processing que vous avez probablement bricolé.
Les nouveaux modèles à connaître
Gemini 3.5 Flash — 19 mai : Le nouveau cheval de course de Google. Vitesse de génération multipliée par 4 par rapport à la 3.1 Flash, et pricing positionné autour d'un tiers des frontière comparables. C'est le candidat naturel pour tout le code qui consomme du Gemini Flash actuellement : la migration vaut une après-midi de tests. Pour les workflows avec beaucoup de requêtes parallèles courtes (extraction, classification, routing), c'est probablement le meilleur ratio qualité/prix disponible. À tester en remplaçant les appels GPT-5.4 Mini ou Claude Haiku dans vos pipelines pour comparer.
Gemini Omni — 19 mai : Le modèle vidéo cinématique de Google. Génération à partir de prompts texte, mais aussi remix à partir d'une image ou d'un clip existant, et édition conversationnelle (rends ça en plan large, remplace le ciel par un coucher de soleil). Concurrent direct des modèles vidéo chinois Seedance et de la dernière vague Veo. Pour le marketing produit ou le content social, la vraie news c'est l'édition itérative en langage naturel : vous arrêtez de regénérer des prompts à l'aveugle pour itérer.
TML-Interaction-Small — 11 mai : 276 milliards de paramètres totaux, 12 milliards actifs, MoE. Le truc à retenir : c'est full-duplex natif, pas une couche au-dessus d'un LLM séquentiel. Le modèle traite l'audio en continu par blocs de 200 ms et répond pendant que vous parlez encore. Disponible en preview chez Thinking Machines uniquement, pas encore via API ouverte. Mais le pari architectural est important : si l'interaction temps réel devient native, les agents vocaux passent du lag awkward au naturel du jour au lendemain.
Les outils IA à activer cette semaine
Gemini Spark — 19 mai : L'agent proactif de Google, en beta pour les Trusted Testers et les abonnés AI Ultra à partir de la semaine prochaine. Spark tourne en continu à travers vos apps Google (Mail, Calendar, Docs, Drive) et propose des actions sans qu'on lui demande explicitement : résumés du jour, drafts de réponses, regroupement de threads, blocs Calendar suggérés. Si vous êtes déjà au fond du puits sur Google Workspace, c'est à tester immédiatement. Si vous êtes sur Microsoft 365, attendez le Copilot Calendar Agent que Microsoft a sorti la semaine dernière — la concurrence directe arrive.
OpenAI Deployment Services : Disponible depuis le 12 mai. Si vous êtes une grande structure et que vous galérez à passer de POC à production sur GPT-5.5, c'est la nouvelle offre que vous regardez. Engagement type : 6 à 12 mois, ingénieurs OpenAI/Tomoro embarqués chez vous, livrables industriels. Pricing pas public, mais positionné pour aller titiller les contrats de transformation à 8 chiffres chez Accenture. Concrètement, vous payez OpenAI pour faire le travail que vous auriez sous-traité à un cabinet de conseil, sauf qu'OpenAI connaît son modèle mieux que personne.
PwC Claude Center of Excellence : Bizarre de mettre un cabinet de conseil dans les outils, mais c'est exactement ça. Si vous êtes une ETI cliente de PwC sur autre chose et que vous voulez piloter un déploiement Claude Code sur une centaine d'ingénieurs sans tout réinventer en interne, le Center of Excellence est le canal. Ils ont la stack, les gabarits de gouvernance et 30 000 personnes formées qui arrivent. À benchmarker contre votre intégrateur historique avant de partir sur une démarche custom.
Les chiffres qui comptent
4 milliards de dollars — la capitalisation initiale de la Deployment Company d'OpenAI. C'est la première fois qu'un fournisseur de modèle s'attaque frontalement à la couche services-conseil. Pour les grands cabinets, c'est un nouveau concurrent direct sur un marché qu'ils dominaient sans partage depuis 30 ans.
150 Forward Deployed Engineers — l'équipe Tomoro qui rejoint OpenAI dès le jour 1. À comparer aux quelques dizaines d'ingénieurs solutions qu'Anthropic et Google ont actuellement chez leurs clients enterprise. OpenAI achète d'un coup une présence terrain qui aurait pris 18 mois à recruter.
200 millions de dollars sur 4 ans — l'engagement Anthropic × Gates Foundation. C'est l'équivalent du chiffre d'affaires annuel de plusieurs startups IA leaders. Anthropic peut se permettre cette dépense parce que sa marge sur l'API a explosé. Le signal pour le secteur : on entre dans l'âge des programmes philanthropiques massifs financés par les revenus IA.
30 000 collaborateurs PwC formés à Claude sur les 300 000 que compte le cabinet. 10% de la force de travail certifiée d'ici fin 2026. Si vous êtes en cabinet de conseil concurrent et que vous n'avez pas commencé un programme similaire, vous avez déjà perdu un cycle complet. Ce n'est plus du R&D, c'est du déploiement.
4 fois plus rapide — Gemini 3.5 Flash par rapport à Gemini 3.1 Flash, pour un coût autour du tiers des modèles frontière comparables. Pour les workflows à fort volume (extraction, classification, routing), c'est probablement le meilleur ratio qualité/prix disponible aujourd'hui. Reste à voir comment GPT-5.5 et Claude répondent.
0,40 seconde de latence de réponse — TML-Interaction-Small chez Thinking Machines. C'est sous le seuil psychologique de la conversation humaine naturelle (autour de 200 à 600 ms). Pour les use cases voix temps réel, le lag awkward qu'on subit aujourd'hui sur la plupart des assistants pourrait disparaître dans les 6 prochains mois.
70% d'amélioration de délai de livraison — ce que PwC reporte sur ses missions client avec Claude. À prendre avec pince : c'est le client qui parle de son client. Mais les exemples concrets sont là : underwriting assurance de 10 semaines à 10 jours, tâches de sécu de plusieurs heures à quelques minutes. C'est la première fois qu'un Big 4 met des métriques de productivité aussi élevées sur la table publiquement.
Mon take — ce que j'en fais concrètement
Beaucoup d'annonces de plateforme cette semaine. Voici comment je hiérarchise les décisions après avoir testé ou benché les sorties accessibles :
Sur Gemini 3.5 Flash dans vos pipelines → À tester immédiatement si vous tournez du GPT-5.4 Mini, du Claude Haiku ou du Gemini 3.1 Flash en volume. Une après-midi de tests sur vos prompts existants vous dira si la migration vaut la facture. Chez B&Inside, c'est exactement le genre d'arbitrage qu'on relance à chaque sortie majeure d'un modèle économique : la facture sur l'extraction et la classification représente plus que le modèle de raisonnement.
Sur la Deployment Company d'OpenAI → Si vous êtes une grande structure qui galère à industrialiser ses POC IA, demandez-leur un appel. Le pitch d'avoir des ingénieurs OpenAI embarqués est radical, et les contrats sont rares pour l'instant, donc il y a une fenêtre courte de fournisseur en mode séduction à exploiter. À titre perso je pousserai Skello à benchmarker l'offre face à leur intégrateur historique.
Sur le combo PwC × Anthropic + OpenAI → Le pattern à copier. Aucune raison de mettre tous vos œufs chez un seul fournisseur quand les deux frontière jouent au qui propose le meilleur deal enterprise. Si vous construisez du B2B SaaS, architecturez votre stack pour switcher de modèle en une heure : un router maison ou OpenRouter, c'est 2 jours de dev qui vous protègent pour les 18 prochains mois.
Sur Gemini Spark et les agents proactifs → À tester si vous êtes déjà profondément sur Google Workspace. Sinon, attendez deux mois : OpenAI Workspace Agents et le nouveau Copilot Calendar Agent vont sortir des features comparables, et le choix se fera sur l'écosystème dans lequel vous êtes déjà ancré, pas sur le modèle sous-jacent.
Sur Thinking Machines et l'interaction temps réel → Surveillance, pas action. Le modèle n'est pas encore en API ouverte. Mais si vous prototypez un assistant vocal ou un agent de support live, gardez l'œil : l'écart de qualité conversationnelle entre du full-duplex natif et des systèmes assemblés à coup d'API va devenir évident d'ici l'automne. C'est le moment d'apprendre la techno, pas de migrer.
Rendez-vous la semaine prochaine
La cadence hebdo tient. Pareil la semaine prochaine : pas de hype, pas de buzzwords, juste les annonces qui font bouger votre stack ou vos décisions.
Si une de ces news vous parle particulièrement — la stratégie multi-modèle, le rapport de force fournisseur-conseil, ou l'arbitrage de latence sur les agents voix — on peut en parler. À la semaine prochaine.
