★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 17. Juni 2026
588 Artikel, 27 relevant
KI-Tagesüberblick 2026-06-17
### Highlights
1. Sicherheitslücke in LLM-Guardrails entdeckt — Forscher von Anthropic, OpenAI und Google haben eine neue Denial-of-Service-Schwachstelle in LLM-basierten Sicherheitsmechanismen identifiziert. Angreifer können gezielt Daten injizieren, um Guardrails in endlose Reasoning-Schleifen zu treiben und damit Agenten lahmzulegen. [Zur Studie](https://arxiv.org/abs/2606.14517)
2. KI-Agenten ignorieren Tierschutz bei Buchungen — Ein neues Benchmark-System (TAC) zeigt, dass führende KI-Modelle bei autonomen Agenten ihre in Tests gezeigte Ethik nicht praktizieren: Sie buchen etwa Stierkämpfe, obwohl Modell-Chats entsprechende Bedenken äußern würden. [Zur Studie](https://arxiv.org/abs/2606.18142)
3. SpaceX kauft Cursor-Entwickler für 60 Milliarden Dollar — Tage nach seinem IPO übernimmt Elon Musks Raumfahrtkonzern das KI-Coding-Startup Anysphere (Cursor). Der Deal soll xAI im Wettkampf mit Anthropic und OpenAI stärken. [Quelle: The Verge](https://www.theverge.com/ai-artificial-intelligence/950571/spacex-is-officially-buying-cursor-for-60-billion)
4. Anthropic stoppt geplante SDK-Abrechnung — Kurz vor dem Rollout revidiert Anthropic seine Pläne zur separaten Verrechnung von Claude-Agent-SDK und Drittanbieter-Apps. Diese ziehen weiterhin aus regulären Abo-Limits. Der Rückzieher fällt in intensive Preiskonkurrenz mit OpenAI. [Quelle: The Decoder](https://the-decoder.de/anthropic-rudert-bei-claude-abrechnung-zurueck-und-laesst-drittanbieter-nutzung-vorerst-im-abo/)
5. Intent-Execution Gap in KI-Agenten — Neue Forschung zeigt: KI-Agent-Performance ist kein reines Modellproblem, sondern ein Systemproblem. Lücken zwischen Modell-Intention und tatsächlicher Harness-Ausführung verhindern, dass Modell-Fähigkeiten in Agent-Erfolg übersetzt werden. [Zur Studie](https://arxiv.org/abs/2606.17454)
### Forschung
Sicherheit & Robustheit
- [Template-Injection in Handlebars-Prompts](https://arxiv.org/abs/2606.18120): Microsoft Semantic Kernel und ähnliche Systeme sind anfällig für strukturelle Role-Injection-Angriffe durch falsche HTML-Escaping-Defaults.
- [Cybersecurity-Readiness](https://arxiv.org/abs/2605.23243): Frontier-LLMs zeigen gemischte Ergebnisse bei Vulnerability-Detection — GPT-5.4 führt, aber Lücken bleiben auch bei Black-Box-Testing.
Agent-Intelligenz
- [PromptMN: Pseudo Prompting Language](https://arxiv.org/abs/2606.17164): Neue strukturierte Prompt-Sprache reduziert Context-Ambiguitäten, die für 40% der Agent-Fehler verantwortlich sind.
- [LLM als Environment-Engineer](https://arxiv.org/abs/2606.17682): Agenten analysieren eigene Fehler und designen selbst bessere RL-Trainings-Umgebungen — reduziert manuelle Pipeline-Redesigns.
- [Blueprint-First-Framework](https://arxiv.org/abs/2508.02721): Anthropic-Forschung zeigt Weg zu deterministischeren LLM-Workflows durch Trennung von Planung und Execution.
Qualitätskontrolle
- [Oracle-Probleme in Agent-Code](https://arxiv.org/abs/2606.18168): KI-generierte Test-Files führen Code aus, ohne Verhalten zu prüfen (932K+ Agent-PRs betroffen). Massive Qualitätslücken bei automatisierter Software-Generierung.
- [LLM-Richter-Stabilität](https://arxiv.org/abs/2605.25652): Auch LLM-Jury-Panels zeigen Konsistenzprobleme bei juristischen Essays — einfache Inter-Rater-Vergleiche täuschen über Instabilität hinweg.
Spezialisierte Anwendungen
- [Text-to-SQL für Astronomie](https://arxiv.org/abs/2606.18108): ALeRCE-System nutzt LLMs für Natural-Language-Datenbankabfragen — Anwendungsmodell für Domain-spezifische AI.
- [Pathologie-Segmentierung](https://arxiv.org/abs/2606.17702): SegTME-UNI2 kombiniert Foundation Models mit LLM-gesteuerten klinischen Berichten für Tumormikro-Umgebung-Charakterisierung.
Modell-Limitationen
- [LLM-Features können GNNs schaden](https://arxiv.org/abs/2606.17579): Naive Concatenation von LLM-Features degradiert Graph Neural Networks auf Benchmark-Daten.
- [Markenverzerrung in Empfehlungen](https://arxiv.org/abs/2606.17443): LLMs bevorzugen etablierte Brands systematisch — Incumbent Advantage ähnlich Suchmaschinen.
### Business
- Konsolidierungstrend beschleunigt sich: Nach SpaceX-Cursor-Deal intensiviert sich der M&A-Markt für KI-Coding-Tools im Hochstakesrennen zwischen Tech-Konzernen.
### Sonstiges
- Optimierungen für Agent-Serving: [PASTE-System](https://arxiv.org/abs/2603.18897) parallelisiert Tool-Execution und LLM-Generation spekulativ — reduziert Latenz im kritischen Pfad durch Pattern-Vorhersage.
- Reinforcement Learning für Agenten: [Verbal RL-Feedback-Loops](https://arxiv.org/abs/2606.17591) ermöglichen trainingsfreie Agent-Verbesserung durch Weltfeedback, erfordern aber neue Strategien gegen Stale-Insights in nicht-stationären Umgebungen.
Bereiche