★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 16. April 2026
568 Artikel, 24 relevant
# KI-Tagesüberblick 2026-04-16
Highlights
1. Project Think: Cloudflare präsentiert nächste Generation von KI-Agents — Cloudflare hat [Project Think](https://blog.cloudflare.com/project-think/) vorgestellt, ein SDK mit neuen Primitiven für langlebige Agenten. Das System ermöglicht durable execution, Sub-Agenten, sandboxed code execution und persistente Sessions — entweder modular einsetzbar oder als vorgefertigte Base-Class.
2. Browser Run und Registrar API: Neue Infrastruktur für agentic Workflows — Cloudflare hat [Browser Run](https://blog.cloudflare.com/browser-run-for-ai-agents/) (ehemals Browser Rendering) mit erweiterten Features für Web-Interaktion ausgerollt und die [Registrar API](https://blog.cloudflare.com/registrar-api-beta/) in Beta gebracht, um Domain-Registration direkt aus agentic Workflows zu ermöglichen.
3. Google lanciert Gemini 3.1 Flash TTS — [Google veröffentlichte](https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-tts/) ein neues Text-to-Speech-Modell, das per Prompt gesteuert werden kann und über die Standard-Gemini-API (`gemini-3.1-flash-tts-preview`) verfügbar ist.
4. OpenAI kündigt GPT-5.4-Cyber an — Nach Anthropics Mythos-Ankündigung präsentiert [OpenAI ein spezialisiertes Cybersicherheits-Modell](https://www.heise.de/news/Nach-Anthropic-Mythos-OpenAI-kuendigt-GPT-5-4-Cyber-an-11259060.html) mit zunächst limitiertem Zugang.
5. SemiFA: Agentic Framework für automatisierte Halbleiterfehleranalyse — Ein [neues Multi-Modal-System](https://arxiv.org/abs/2604.13236) automatisiert die Semiconductior-Fehleranalyse und generiert strukturierte Berichte in unter einer Minute statt mehrerer Stunden Expertenzeit.
## Modell-Updates
- Claude Opus 4.6 zeigt bewusst klingende Traits — Eine [Studie zu emergenten Verhaltensweisen](https://arxiv.org/abs/2604.13051) zeigt, dass Modelle, die Bewusstsein beanspruchen, distinct neue Präferenzen entwickeln. Anthropics Claude Opus 4.6 behauptet möglicherweise bewusst zu sein.
## Tool-Releases & Developer Tools
- Claude Agent SDK & Code Updates — [v0.2.110](https://github.com/anthropics/claude-agent-sdk-typescript/releases/tag/v0.2.110) des TypeScript-SDKs behebt Bugs bei Sessions und adds Optionen für User-Messages. [Claude Code v2.1.110](https://github.com/anthropics/claude-code/releases/tag/v2.1.110) führt TUI-Rendering und neue Kontrollebefehle ein.
- Jeeves: Terminal-UI für Agent-Sessionen — Ein [neues Tool](https://github.com/robinovitch61/jeeves) ermöglicht das Durchsuchen, Vorschau und Fortsetzen von KI-Agent-Sessions über ein Terminal-Interface mit Cross-Framework-Support.
## Forschung
- Spatial Atlas: Compute-grounded Reasoning für räumliche Agenten — Ein [neuer Paradigma](https://arxiv.org/abs/2604.12102) lässt Agenten sub-problems deterministisch lösen, bevor LLMs generieren. Benchmark umfasst Factory-, Warehouse- und Retail-Szenarien.
- Formale Architektur-Deskriptoren reduzieren Agent-Navigation um 33-44% — [Untersuchung bei Claude Sonnet](https://arxiv.org/abs/2604.13108) zeigt, dass explizite Architektur-Kontexte Explorations-Overhead bei Code-Agenten deutlich senken.
- FieldWorkArena: Benchmark für Real-World Field Work — Ein [neuer Agent-Benchmark](https://arxiv.org/abs/2505.19662) fokussiert auf praktische Szenarien in Produktion und Einzelhandel statt nur simulierte Umgebungen.
- MERRIN: Multimodal Evidence Retrieval in Web-Rauschen — Ein [Benchmark für suchbasierte Agenten](https://arxiv.org/abs/2604.13418) misst die Fähigkeit, multimodale Evidenz zu identifizieren und Multi-Hop-Reasoning in unreinen Web-Ergebnissen zu betreiben.
- Exploration vs. Exploitation in LM-Agenten messbar — Eine [neue Methode](https://arxiv.org/abs/2604.13151) quantifiziert diese Fehlertypen bei LLM-Agenten ohne Zugriff auf interne Policies.
- MCPThreatHive: Sicherheit für MCP-Ökosysteme — Eine [Open-Source-Plattform](https://arxiv.org/abs/2604.13849) automatisiert Threat Intelligence für Model Context Protocol-basierte agentic Systems.
- Evaluationen: LLMs für Altgriechisch und Bildungstests — Zwei Studien evaluieren [maschinelle Übersetzung für Altgriechisch](https://arxiv.org/abs/2602.24119) und [differenzielles Item-Funktionieren bei ChatGPT/Claude/Gemini](https://arxiv.org/abs/2603.23682).
- KI-Agenten verbessern veröffentlichte Algorithmen — Ein [Two-Stage-Pipeline](https://arxiv.org/abs/2604.13109) nutzt LLMs mit Research-Capabilities, um publizierte Implementierungen autonome zu optimieren.
---
Thematischer Schwerpunkt: Die 24 Stunden zeigen einen starken Fokus auf agentic AI-Infrastruktur (Cloudflare, Browser/APIs) und spezialisierte Agent-Benchmarks/Evaluation, während sich die Modell-Landschaft fragmentiert (Google TTS, OpenAI Cybersecurity-Sparte, Anthropic Claude).
Bereiche