★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 15. April 2026
634 Artikel, 48 relevant
KI-Tagesüberblick 2026-04-15
### Highlights
1. LLM-Agenten scheitern bei Langzeit-Aufgaben — Neue Benchmark "[HORIZON](https://arxiv.org/abs/2604.11978)" diagnostiziert systematisch, wo und warum Agenten bei mehrstufigen, voneinander abhängigen Aktionssequenzen zusammenbrechen. Bisher fehlte es an standardisierten Diagnose-Werkzeugen für dieses Problem.
2. Produktive Agent-Evaluierung neu definiert — [AlphaEval](https://arxiv.org/abs/2604.12162) adressiert den Mismatch zwischen existierenden Benchmarks und realen Produktionsumgebungen, wo Anforderungen implizit sind und Metriken nicht deterministisch.
3. Token-Effizienz bei Coding-Agenten — [Local-Splitter](https://arxiv.org/abs/2604.12301) stellt sieben Taktiken vor (lokales Routing, Prompt-Kompression, Semantic Caching, lokales Drafting), um Cloud-LLM-Nutzung mit kleineren lokalen Modellen als Triage-Layer zu senken.
4. Sicherheitsrisiken bei "Vibe Coding" — Studie zu [LLM-generierten Codes im Bauwesen](https://arxiv.org/abs/2604.12311) warnt vor „stillen Fehlern", wenn Non-Techniker über Natural Language Code generieren – besonders kritisch für Sicherheitsanwendungen.
5. Arbeitsbelastung steigt trotz KI — [Latent Space berichtet](https://www.latent.space/p/ainews-humanitys-last-gasp), dass Teams in Silicon Valley intensiver arbeiten als je zuvor, nicht weniger – KI erhöht Komplexität statt sie zu reduzieren.
### Forschung
- [Spatial Atlas](https://arxiv.org/abs/2604.12102): Compute-Grounded Reasoning für räumlich-bewusste Research-Agenten – deterministische Berechnungen vor LLM-Einsatz.
- [AnyPoC](https://arxiv.org/abs/2604.11950): Automatische Proof-of-Concept-Test-Generierung zur Validierung von LLM-erkannten Bugs in Quellcode.
- [Progressive Curriculum Learning](https://arxiv.org/abs/2604.12666): Robustere Web-Agenten durch Diskrimination falsch-plausiblen HTML-Elementen.
- [Cooperative Memory Paging](https://arxiv.org/abs/2604.12376): Kontext-Fenster-Management über Keyword-Bookmarks für lange Gespräche.
- [Frontier-Eng](https://arxiv.org/abs/2604.12290): Benchmark für iterative generative Optimierung (Propose-Execute-Evaluate-Loop).
- [StoryScope](https://arxiv.org/abs/2604.03136): KI-Fiktion kann auf Narrativ-Ebene unterschieden werden, nicht nur durch stilistische Merkmale.
- [Identifiable Victim Effect in LLMs](https://arxiv.org/abs/2604.12076): Alignment und Chain-of-Thought-Reasoning verstärken emotionale Verzerrungen bei Ressourcenallokation.
### Tool-Releases & Ecosystem
- [LangAlpha](https://github.com/ginlix-ai/langalpha): Claude Code für Finanzmarkt – löst MCP-Skalierungsprobleme durch Auto-generierte Python-Module statt Token-intensive Tool-Schemas.
- [MCPTube v2](https://github.com/0xchamin/mcptube): Karpathy-Style LLM-Wiki für YouTube-Videos mit verbessertem Semantic Search und Vision-Features.
- [Kontext CLI](https://github.com/kontext-dev/kontext-cli): Credential Broker für KI-Coding-Agenten – sicherer Zugriff auf GitHub, APIs, Datenbanken mit Audit-Trail statt hardcodierter Secrets.
- [Gemini CLI v0.40.0](https://github.com/google-gemini/gemini-cli): Updates zu Generalist-Agent-Dokumentation und MCP-Error-Handling.
- [LangChain OpenAI 1.1.13](https://github.com/langchain-ai/langchain): Bug-Fix für Content-Block-Parsing in Responses API.
### Sonstiges
Trend: Finanzsektor und Engineering-Domänen treiben spezialisierte Agent-Frameworks voran, während zentrale Sicherheits- und Evaluierungsfragen (Long-Horizon-Failures, Produktion-Realismus) zunehmend adressiert werden.
Bereiche