Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 32065+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 21. Mai 2026 628 Artikel, 27 relevant
# KI-Tagesüberblick 2026-05-21

Highlights

1. Code Researcher: LLM-Agenten für komplexe Systeme — [OpenAI und Google](https://arxiv.org/abs/2506.11060) präsentieren einen Deep Research Agent, der LLM-basierte Coding Agents für große Systemcodebasen einsatzfähig macht. Das Tool kann umfangreiche Kontexte aus Code und Commit-Historie recherchieren, bevor es Änderungen vornimmt — ein bedeutender Schritt über bisherige Benchmark-Tests hinaus.

2. Discovery-to-Application Gap bei KI-Agenten — [Anthropic, OpenAI und Google](https://arxiv.org/abs/2604.24697) evaluieren mit "SciCrafter" erstmals, ob aktuelle Agenten wissenschaftliche Erkenntnisse tatsächlich in funktionierende Systeme umsetzen können. Das Minecraft-basierte Benchmark zeigt erhebliche Lücken zwischen Theorie und praktischer Anwendung.

3. DeepSeek tritt mit eigenem Code-Agent an — [DeepSeek baut ein neues Team in Peking auf](https://the-decoder.de/deepseek-will-mit-deepseek-code-direkt-gegen-claude-code-und-openais-codex-antreten/), das unter dem Arbeitstitel "DeepSeek Code" gegen Claude Code und OpenAI Codex antreten soll. Gesucht werden Experten für Agent Loops, MCP und Context Engineering.

4. KI-Reviewer in wissenschaftlicher Peer Review — [Studie mit 45 Experten](https://arxiv.org/abs/2605.20668) bewertet erstmals systematisch, wo KI-Reviewer in der wissenschaftlichen Begutachtung überzeugen und wo sie scheitern — ein kritischer Test für den Einsatz in Nature-family Journals.

5. AI-Text-Detection unter Druck — [Die Counter Turing Test Findings](https://arxiv.org/abs/2605.20761) zeigen, dass moderne Modelle (GPT-4, Claude 3.5, Llama) Texte so human-ähnlich generieren, dass Unterscheidung zunehmend unmöglich wird — ein wachsendes Problem für Content-Integrität.

## Modell-Updates

- Claude Agent SDK v0.3.146 — [Anthropic](https://github.com/anthropics/claude-agent-sdk-typescript/releases/tag/v0.3.146) aktualisiert das TypeScript SDK auf Parität mit Claude Code v2.1.146.

## Tool-Releases & Frameworks

- Microsoft Security Copilot (DTDA) — [Adaptive Agent für Threat Detection](https://arxiv.org/abs/2605.20896): Ein kontinuierlich lernender Agent, der Security Incidents eigenständig untersucht und Erkenntnisse in Detection-Logik übersetzt.

- MemGym — [Neues Benchmark-Environment](https://arxiv.org/abs/2605.20833) für Long-Horizon Memory in LLM-Agenten, adressiert bisherige Lücken bei Retention in realistischen Agentic-Szenarien wie Coding und Web Navigation.

- TorchSight — [Open-Source System für Sicherheitsdokument-Klassifizierung](https://arxiv.org/abs/2605.20368) mit fine-getunetem Qwen 3.5 27B Model, trainiert auf 78.358 Samples aus 13 Quellen.

## Forschung

- Self-Training strukturiert Sprache neu — [Studie zeigt](https://arxiv.org/abs/2605.20602), dass iteratives Self-Training bei Sprachmodellen nicht zu Flatten führt, sondern zu Umstrukturierung: Oberflächenmarker werden verstärkt, tiefe Syntaxstruktur erodiert.

- Voice Tool-Calling Evaluation — [Framework für Audio-basierte Agents](https://arxiv.org/abs/2605.15104): Text-basierte Benchmarks lassen sich mittels Text-to-Speech und Umgebungsrauschen in kontrollierte Audio-Evaluationen überführen.

- Commitment Depth bei Vision-Language Reasoning — [Forschung zu temporal Abstraction](https://arxiv.org/abs/2605.09860): Agenten lernen optimal, wie viele primitive Actions sie open-loop ausführen, bevor replanning notwendig wird.

- Corpus-Level Trace Diagnostics (Insights Generator) — [Neue Methode](https://arxiv.org/abs/2605.21347) für systematische Fehleranalyse in LLM-Agenten, die Patterns über gesamte Trace-Populationen erkennt statt einzelne Fälle zu inspizieren.

- ProcBench für Coding Agents — [Benchmark-Framework](https://arxiv.org/abs/2605.20251) evaluiert prozess-Level Defekte und Control-Preservation, nicht nur finale Outcomes — wichtig für praktische Einsatztauglichkeit.

- LLMs für Grammar-Adaptation — [Automatische Metamodel-Evolution](https://arxiv.org/abs/2605.21465) in Model-Driven Engineering durch LLM-basierte Grammatik-Anpassung.

## Sonstiges

- Google I/O: Vorsicht vor "Coming Soon" — [Simon Willison kritisiert](https://simonwillison.net/2026/May/20/google-io/#atom-everything), dass viele Google I/O Ankündigungen nicht produktionsreif sind — schreibt nur über verfügbare Features, da Preview-Versionen oft nicht mit finalen Releases übereinstimmen.
▶ Top Playbooks Alle Playbooks →
Bereiche