Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIA2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIA2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 23451+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 07. Mai 2026 566 Artikel, 31 relevant
# KI-Tagesuebersicht 2026-05-07

Highlights

1. Spezialisierte KI schlägt Frontier-Modelle bei Pharma-Recherche — Die Plattform Gosset mit kuratiertem Datensatz übertrifft Claude Opus 4.7, GPT 5.5 und Gemini 3.1 Pro bei der Identifikation von Oncology/Immunology-Assets. Zeigt, dass Domain-Expertise wichtiger als generelle Leistung sein kann. ([arxiv.org/abs/2605.04908](https://arxiv.org/abs/2605.04908))

2. Thinking Mode ändert moralische Urteile von LLMs nicht signifikant — Vergleich über 100 moralische Szenarien und 5 Frontier-Modelle zeigt: Reasoning-Modi produzieren konsistente Ergebnisse, aber keine substanziellen Unterschiede bei ethischen Urteilen. ([arxiv.org/abs/2605.04488](https://arxiv.org/abs/2605.04488))

3. Tool-Schema-Probleme kosten Agenten Zuverlässigkeit — TSCG-Framework deckt auf: Bei Small Models (4B-14B) scheitern bis zu 50% der Tool-Calls wegen JSON-Format-Mismatch zwischen API und LLM. ([arxiv.org/abs/2605.04107](https://arxiv.org/abs/2605.04107))

4. In-Context Prompting schlägt Agent-Orchestrierung — Neue Vergleichsstudie: Procedurales Reasoning funktioniert besser, wenn die gesamte Procedure im System Prompt liegt, statt externe Orchestration (LangGraph, CrewAI) zu nutzen. ([arxiv.org/abs/2604.27891](https://arxiv.org/abs/2604.27891))

5. LLMs scheitern bei Multimodalen STEM-Aufgaben — Physik-Probleme mit Diagrammen zeigen systematische Fehler bei Bildverarbeitung. Framework für Fehlerkorrektur durch Dialog entwickelt. ([arxiv.org/abs/2605.04131](https://arxiv.org/abs/2605.04131))

## Modell-Updates

- Claude Code v2.1.132 — Neue `CLAUDE_CODE_SESSION_ID` Environment-Variable, Option zum Deaktivieren des Alternate-Screen-Renderers, UX-Verbesserungen beim Bild-Einfügen. ([github.com/anthropics/claude-code](https://github.com/anthropics/claude-code/releases/tag/v2.1.132))

## Tool-Releases & Framework-Updates

- LangChain 1.3.0a2 — Alpha-Release mit Schema-Resolution-Fixes und ordnungsabhängiger State-Handling. ([github.com/langchain-ai](https://github.com/langchain-ai/langchain/releases/tag/langchain%3D%3D1.3.0a2))

- Better Design (28 Shadcn-Systeme) — OSS-Sammlung von Design-Systemen mit MCP-Integration für Cursor/Claude Code. ([github.com/marvkr/better-design](https://github.com/marvkr/better-design))

## Forschung

- SADE: Netzwerk-Troubleshooting — Neuer Agent-Ansatz für Netzwerk-Diagnose mit Layer-für-Layer-Methodik statt freier Deliberation. Verbessert Root-Cause-Lokalisierung. ([arxiv.org/abs/2605.04530](https://arxiv.org/abs/2605.04530))

- MRI-Eval Benchmark — Neue Evaluierung für MRI-Physik und GE-Scanner-Operationen mit Benchmarks für vendor-spezifisches Wissen. ([arxiv.org/abs/2605.05175](https://arxiv.org/abs/2605.05175))

- Nsanku: Ghanaische Sprachen-Übersetzung — Evaluation von 19 LLMs auf 43 ghanaischen Sprachen zeigt persistent schlechte Low-Resource-Performance. ([arxiv.org/abs/2605.04208](https://arxiv.org/abs/2605.04208))

- Lossless Context Management (LCM) — Speicher-Architektur für lange Kontexte (bis 1M Tokens). Volt-Agent schlägt Claude Code auf OOLONG-Benchmarks. ([arxiv.org/abs/2605.04050](https://arxiv.org/abs/2605.04050))

- Agent Island: Saturation-resistenter Benchmark — Multiplayer-Simulations-Umgebung verhindert Benchmark-Saturation durch dynamische Konkurrenzsituationen. ([arxiv.org/abs/2605.04312](https://arxiv.org/abs/2605.04312))

- True Memory Architecture — SQLite-basierte Agentur-Speicher-Pipeline mit verbatim Event-Preservation statt nur Extraktion. Läuft auf Standard-CPUs ohne externe DBs. ([arxiv.org/abs/2605.04897](https://arxiv.org/abs/2605.04897))

- Cyber-Security mit LLMs — Pen-Strategist-Framework für Penetration-Testing mit verbessertem LLM-Agent-Design gegen bestehende Schwächen. ([arxiv.org/abs/2605.04499](https://arxiv.org/abs/2605.04499))

- Frontier Lag Audit — Bibliometrische Analyse: Viele Academic-Papers evaluieren alte Modelle gegen neue Frontier-Systeme und repräsentieren daher veraltete Capability-Aussagen. ([arxiv.org/abs/2605.04135](https://arxiv.org/abs/2605.04135))

- AsymmetryZero: RL-Evaluationen — Framework zur Operationalisierung von Expert-Preferences als semantische Evaluationen für RL-Training. ([arxiv.org/abs/2605.04083](https://arxiv.org/abs/2605.04083))

- AI Alignment via Incentives — Law-and-Economics-Perspektive auf AI-Alignment: Misconduct als strategische Response auf Anreize. ([arxiv.org/abs/2605.01643](https://arxiv.org/abs/2605.01643))

- Graph-Enhanced MoE für Dialogue State Tracking — GEM-Framework kombiniert Graph-Strukturen mit ReAct-Agenten für präzise Information-Extraction aus Multi-Domain-Gesprächen. ([arxiv.org/abs/2605.04449](https://arxiv.org/abs/2605.04449))

- GRAIL: Agent Discovery Framework — Hybrid-Indexing für schnelle Agent-Discovery ohne LLM-Bottleneck, SLM-Enhanced für Sub-30-Sekunden-Latenz. ([arxiv.org/abs/2605.02489](https://arxiv.org/abs/2605.02489))

---

Fazit: Der Fokus liegt auf Spezialisierung statt reiner Model-Skalierung, sowie auf grundlegenden Architektur-Verbesserungen für Agents und Memory. Signifikante Erkenntnisse zu Tool-Use-Zuverlässigkeit und Benchmark-Methodologie.
▶ Top Playbooks Alle Playbooks →
Bereiche