← Back to archive

Signals for 18 May 2026

Published 2026-05-18T08:15+02:00

Drie signalen over agentic productintegratie, evaluatie van AI die moet kunnen toegeven dat een taak onmogelijk is, en mobiele agents die echte app-workflows bedienen.

Greg Brockman consolidates OpenAI's product teams to build an "agentic future"

The Decoder

OpenAI brengt ChatGPT, Codex en de developer API dichter bij elkaar onder één productteam. Dit is relevant omdat de builderlaag rond AI concreter wordt: tools, runtimes en ontwikkelworkflows bepalen steeds vaker de echte hefboom.

#agent #builder #tooling-runtime

New math benchmark reveals AI models confidently solve problems that have no solution

The Decoder

SOOHAK test expliciet of modellen herkennen dat sommige problemen geen oplossing hebben. Dit is relevant omdat serieuze AI-implementatie valt of staat met evaluatie, betrouwbaarheid en begrip van nieuwe failure modes.

#evals #research-evals

Oppo open-sources Android AI agent X-OmniClaw that uses your camera, screen, and voice without leaving the phone

The Decoder

Oppo's X-OmniClaw draait op Android, gebruikt camera, scherm en stemcontext, en zet tap-routes om in herbruikbare skills. Dit is relevant omdat agentwaarde steeds meer in workflowontwerp en taakafbakening zit, niet alleen in een slimmer model.

#agent #agentic-workflows #evals