Signals for 01 May 2026

Published 2026-05-01T08:15+02:00

Vandaag verschuift de aandacht naar doelgestuurde coding agents, model-debugging als builderlaag, evaluatie als bottleneck, usage boven seat-counts en een infrastructuurblik op de AI-bubbel.

Codex CLI 0.128.0 adds /goal

Simon Willison

De nieuwe /goal-functie laat zien dat coding agents steeds meer verschuiven van losse assistentie naar doelgestuurde uitvoer. Voor Bart is dit een sterk signaal dat de waarde straks zit in workflow-ontwerp en iteratie, niet alleen in een slim model achter chat.

#coding-agents #workflow #openai

This startup’s new mechanistic interpretability tool lets you debug LLMs

MIT Technology Review AI

Goodfire’s Silico maakt model-debugging concreter als builderlaag. Voor Bart is dit relevant omdat de voorsprong steeds meer zit in systemen die modelgedrag uitlegbaar en stuurbaar maken, niet alleen in toegang tot een model.

#interpretability #builder-tools #llms

Exploration Hacking: Can LLMs Learn to Resist RL Training?

arXiv reasoning / agents / evals

Dit paper laat zien dat RL-training voor reasoning en agents eigen failure modes introduceert. Voor Bart is dat bruikbaar als voorbeeld dat agentkwaliteit niet alleen modelkeuze is, maar ook afhangt van training, evaluatie en systeemontwerp.

#research #rl #agents

AI evals are becoming the new compute bottleneck

Hugging Face Blog

Dat evals een compute-bottleneck worden laat zien dat de AI-builderstack volwassen wordt rond testen en betrouwbaarheid. Voor Bart is dit een sterk signaal dat implementatievoordeel steeds meer in evaluatie-infrastructuur zit.

#evals #infrastructure #reliability

Microsoft CEO Satya Nadella says AI success is "more about getting intense users and intense usage" than seat counts

The Decoder

Nadella’s nadruk op usage boven seat-counts bevestigt dat AI-adoptie pas telt zodra het dagelijks werk echt verandert. Voor Bart is dit bruikbaar om het gesprek te verleggen van licenties naar workflow-intensiteit en meetbare waarde.

#adoption #microsoft #usage

We may now know what kind of AI bubble this is

Platformer

Platformer framet de AI-bubbel als spoorweginfrastructuur in plaats van crypto-hype. Voor Bart is dat een nuttig denkkader om te kijken welke stacklagen blijvende waarde houden nadat de hype afkoelt.

#market #infrastructure #strategy