★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 18. Juni 2026
540 Artikel, 26 relevant
# KI-Tagesüberblick 2026-06-18
Highlights
1. GLM-5.2: Mächtiges Open-Source Sprachmodell veröffentlicht — Das chinesische AI-Lab Z.ai hat [GLM-5.2](https://simonwillison.net/2026/Jun/17/glm-52/#atom-everything), ein 753B-Parameter-Modell mit 40 aktiven Parametern (Mixture of Experts), unter MIT-Lizenz freigegeben. Es gilt derzeit als eines der leistungsfähigsten vollständig open-source Sprachmodelle.
2. Agent-Sicherheit im Fokus: Mehrere kritische Benchmarks vorgestellt — Neue Evaluationsrahmen zeigen erhebliche Sicherheitslücken bei KI-Agenten auf: [LivePI](https://arxiv.org/abs/2605.17986) untersucht Indirect Prompt Injection, [SafeClawBench](https://arxiv.org/abs/2606.18356) differenziert zwischen semantischen und praktischen Schäden bei Tool-Use-Agenten.
3. Intent-Execution Gap als fundamentales Problem identifiziert — [Forschung von Anthropic, OpenAI und Google](https://arxiv.org/abs/2606.17454) zeigt, dass KI-Agent-Performance nicht nur ein Modellproblem ist, sondern ein Systemintegrations-Problem. Lücken zwischen Modellintention und tatsächlicher Agent-Ausführung verhindern volle Capability-Realisierung.
4. Agenten für spezialisierte Domänen evaluiert — [TxBench-PP](https://arxiv.org/abs/2606.19245) benchmarkt KI-Agenten in Pharmazie, [ResearchClawBench](https://arxiv.org/abs/2606.07591) testet autonome Forschung über 40 Tasks in 10 wissenschaftlichen Domänen.
5. Praktische Agent-Deployments in Produktion — Cloudflare bringt [Cloudflare One Stack mit Agent-Powered Deployment](https://blog.cloudflare.com/cloudflare-one-stack/), während [Adam (YC W25)](https://github.com/Adam-CAD/CADAM) Open-Source AI-Agenten für mechanisches CAD-Design entwickelt.
## Modell-Updates
- GLM-5.2: 753B-Parameter Open-Weights Modell von Z.ai, nur Text-Input, unter MIT-Lizenz verfügbar
## Tool-Releases
- [Mira](https://github.com/miracodeai/mira) — Open-source, selbstgehosteter KI-Code-Reviewer mit durchschnittlicher Review-Zeit von 77 Sekunden (vs. 5 Minuten bei Konkurrenten)
- [Adam CADAM](https://github.com/Adam-CAD/CADAM) — Open-Source Text-to-CAD Platform für mechanische Designgenerierung
- [Claude Code v2.1.181](https://github.com/anthropics/claude-code/releases/tag/v2.1.181) — Neue Config-Syntax, macOS Apple Events Support
## Forschung
- Agent-Verhalten-Analyse: [Dissecting Model Behavior Through Agent Trajectories](https://arxiv.org/abs/2606.17454) untersucht die Lücke zwischen Modellintention und praktischer Harness-Ausführung
- Sicherheit Tool-Use-Agenten: [SafeClawBench](https://arxiv.org/abs/2606.18356) differenziert zwischen semantischen, Audit- und Sandbox-Schäden
- Domain-Camouflaged Attacks: [Evaluierung von Prompting-basierten Defenses](https://arxiv.org/abs/2606.18530) gegen Injektionsangriffe
- Long-Horizon Agent-Fähigkeiten: [CEO-Bench](https://arxiv.org/abs/2606.18543) testet Agenten auf komplexen, langfristigen Aufgaben
- Menschenähnliches Verhalten: [Multi-dimensionale Analyse](https://arxiv.org/abs/2606.18258) von LLM-Verhaltensweisen und System-Prompts
- Code-Sicherheit durch Agenten: [Code-Augur](https://arxiv.org/abs/2606.18619) beschreibt agentic vulnerability detection durch Spezifikations-Inferenz
- Kontekt-Engineering: [Praktischer Guide für Python-Projekte](https://realpython.com/python-context-engineering-ai/) zur Optimierung von Agent-Context-Windows
## Business & Infrastruktur
- Cloudflare One Stack: Agent-basierte Deployment-Lösung für Zero-Trust-Architektur-Migration
- Curriculum für Agenten-Feedback: [CAPRA](https://arxiv.org/abs/2606.18976) automatisiert Bewertung von Software-Architecture-Deliverables in der Ausbildung
Bereiche