★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 22. April 2026
634 Artikel, 33 relevant
KI-Tagesüberblick 2026-04-22
### Highlights
1. OpenAI präsentiert ChatGPT Images 2.0 — OpenAI hat ein neues Bildgenerierungsmodell veröffentlicht. Sam Altman beschrieb den Sprung vom Vorgänger als Äquivalent zum Upgrade von GPT-3 auf GPT-5. Der Qualitätssprung bei der Bildgenerierung wird als erheblich eingestuft.
2. Cyber Defense Benchmark für Threat Hunting — [Anthropic, OpenAI und Google präsentierten einen neuen Benchmark](https://arxiv.org/abs/2604.19533) zur Bewertung von LLM-Agenten im SOC-Betrieb. Der Benchmark testet Threat-Hunting-Fähigkeiten anhand von 106 echten Angriffsszenarien aus der MITRE ATT&CK-Datenbank.
3. GitHub Copilot Pricing-Änderungen — [GitHub kündigte Anpassungen bei den Individual-Plänen für Copilot an](https://simonwillison.net/2026/Apr/22/changes-to-github-copilot/). Dies folgt auf Preisverkündigungen bei konkurrierenden Angeboten.
4. Claude Code Preis-Verwirrung geklärt — Anthropic hatte kurzzeitig $100/Monat für Claude Code kommuniziert, [hat diese Ankündigung aber bereits wieder revidiert](https://simonwillison.net/2026/Apr/22/claude-code-confusion/). Der Funktionsumfang bleibt vorerst in bestehenden Plänen enthalten.
5. Potenzielle Cursor-Akquisition durch SpaceX — SpaceX soll in Verhandlungen mit dem KI-Coding-Startup Cursor über eine Übernahme im Wert von etwa $60 Milliarden sein.
### Modell-Updates
- Claude Code Release v2.1.117: Verbesserungen bei Agent-Management, Modellauswahl-Persistierung über Neustarts und MCP-Server-Unterstützung.
- Konsistenz-Vergleich von Übungsverschreibungen: [Eine Studie vergleicht GPT-4.1, Claude Sonnet 4.6 und Gemini 2.5 Flash](https://arxiv.org/abs/2604.19598) bei wiederholter Generierung unter standardisierten Bedingungen — relevante Erkenntnisse für Zuverlässigkeit in klinischen Anwendungen.
### Forschung
- Verbale Macken in LLMs: [Eine systematische Analyse zeigt eine zunehmende Häufung formulaischer Sprachmuster](https://arxiv.org/abs/2604.19139) (Sycophantismus, Pseudo-Empathie) in frontier models, ein Nebeneffekt von RLHF und Constitutional AI.
- Debugging mit interaktiven Tools: [Debug2Fix untersucht, wie Debugging-Funktionen Coding Agents helfen können, mehr Bugs zu beheben](https://arxiv.org/abs/2602.18571) — geht über statische Analyse und Trial-and-Error-Zyklen hinaus.
- Repair-Verhalten in Multi-Turn-Dialogen: [Untersuchung zeigt starke Unterschiede zwischen GPT und Claude](https://arxiv.org/abs/2604.19245) beim Umgang mit fehlerhaften oder unlösbaren Fragen.
- GPU-Code-Transpilation (CASS): [Ein neues Dataset und Modell-Suite für CUDA-zu-HIP-Übersetzung](https://arxiv.org/abs/2505.16968) mit 60k verifizierten Host-Device-Paaren.
- Rechtliche KI-Benchmarks: Neue Datensätze für [brasilianische Rechtsfallklassifizierung](https://arxiv.org/abs/2604.18878) und [malaysisches Vertragsrecht](https://arxiv.org/abs/2604.19464) zeigen praktische Anwendungen bei Zugang zu Justiz.
### Tool-Releases
- ctx: [Ein persistentes SQLite-basiertes Skill-System](https://github.com/dchu917/ctx) für Claude Code und andere Agenten, das Workstreams über mehrere Sessions hinweg speichert.
Bereiche