Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 37775+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 01. Juni 2026 604 Artikel, 26 relevant
# KI-Tagesüberblick 2026-06-01

Highlights

1. LLM-Bias-Studien zeigen persistente Fairness-Probleme — Umfassende Evaluierungen von Claude, GPT und Gemini enthüllen gender-, rassen- und altersbezogene Disparitäten in Entscheidungsszenarien. Die Debiasing-Bemühungen führen oft zu neuen Fairness-Trade-offs statt echte Lösungen zu bieten. Cross-linguistischen Tests (Englisch, Koreanisch, Chinesisch, Japanisch) zeigen, dass östliche Sprachmodelle teilweise andere Bias-Muster aufweisen.

2. Sicherheitslücken bei Tool-basierten LLM-Agenten — Forschung zu indirekten Prompt-Injections offenbart kritische Verwundbarkeiten in ReAct-Agenten: Adversaries können über kontrollierte Tool-Outputs die Agent-Ziele umlenken. Besonders problematisch sind Tool-Beschreibungen, die bei jedem Turn gelesen werden und als zusätzliche Angriffsfläche dienen.

3. Multimodale Modelle scheitern bei physikalischem Reasoning — Das neue BilliardPhys-Bench-Benchmark zeigt, dass führende Multimodal-LLMs intuitive physikalische Vorhersagen aus statischen Bildern nicht zuverlässig treffen können — ein erhebliches Defizit für Robotik- und Simulationsanwendungen.

4. Memory-Management für langfristige Agent-Sessionen — Neue Systeme wie [Eywa](https://arxiv.org/abs/2605.30771) und [VikingMem](https://arxiv.org/abs/2605.29640) adressieren das Context-Window-Problem durch provenance-grounded Memory mit Audit- und Löschfunktionen sowie generalisierbare Speicherextraktionsmethoden.

5. Anthropic dominiert agentic-AI-Implementierungen — Claude Code outperformte OpenAIs Codex in einer head-to-head Gravitationswellen-Datenanalyse und zeigt Fortschritte bei autonomer Code-Execution ohne menschliche Intervention.

## Forschung

- [Experience Learning für Agents](https://arxiv.org/abs/2605.30712) — ExpGraph ermöglicht modell-agnostisches Lernen aus prior experience mit graph-strukturiertem Memory; Agent-Fehler werden als Lernquelle systematisch genutzt.

- [Social AI Safety Framework](https://arxiv.org/abs/2605.30654) — EUDAIMONIA evaluiert unerwünschte soziale Dynamiken bei LLM-Companion-Anwendungen (Emotional Disclosure, parasoziale Beziehungen).

- [Klinische NLP in Non-English-Sprachen](https://arxiv.org/abs/2605.30529) — Generische Embedding-Modelle schneiden bei ICD-10-Kodierung in Nicht-Englisch-Sprachen deutlich schlechter ab; Large Generative Models können diese Lücke als Data Factories schließen.

- [Safety für embodied Agents](https://arxiv.org/abs/2605.30924) — EMBGuard entkoppelt physische Risiko-Erkennung von Agent-Policy zur Prävention unsicherer Robot-Aktionen.

## Modell-Updates

- [Mellum 2 Release](https://arxiv.org/abs/2605.31268) — Open-weight 12B-Parameter Mixture-of-Experts Modell (2.5B aktive Parameter) mit Spezialisierung auf Software Engineering, Code-Editing und agentic Coding.

## Business & Markt

- Anthropic's starker Monat — Laut Simon Willisons Mai-Newsletter hatte Anthropic einen besonders erfolgreichen Monat; KI-Kosten sind gestiegen, während "Model Releases etwas enttäuschend" ausfallen.

## Sonstiges

- [Benchmark für visuelle Assistenz](https://arxiv.org/abs/2605.31351) — VIABLE ist das erste Benchmark-Set für VLM-as-Judge Evaluation in Anwendungen für Sehbehinderte.

- [Vulnerability Task Generation](https://arxiv.org/abs/2602.03012) — CVE-Factory automatisiert die Transformation von CVE-Metadaten in ausführbare Agent-Tasks auf Expert-Level zur Evaluierung von Code-Security-Fähigkeiten.
▶ Top Playbooks Alle Playbooks →
Bereiche