Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 49174+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 24. Juni 2026 542 Artikel, 19 relevant
KI-Tagesüberlick 2026-06-24

### Highlights

1. LLM-basierte Such-Agenten anfällig für Manipulation — [SearchGEO-Framework](https://arxiv.org/abs/2606.16821) zeigt, dass LLM-Search-Agenten manipulierte Web-Inhalte als glaubwürdige Empfehlungen weitergeben. Die Studie definiert eine fünfteilige Angriffstaxonomie und misst die Anfälligkeit von Claude und ChatGPT.

2. KI-Agenten in Code-Repositories massiv verbreitet — [Analyse von 180 Millionen Git-Repositories](https://arxiv.org/abs/2606.24429) detektiert erstmals systematisch KI-Coding-Agenten durch Multi-Layer-Framework (Config-Analyse, Commit-Messages, Bot-Signaturen). Zeigt unsichtbare Durchdringung der Open-Source-Supply-Chain.

3. Kausalschlussfolgerung in LLMs nicht robust — [Studie zur "Causal Caution"](https://arxiv.org/abs/2606.24370) belegt: LLMs unterdrücken Vorsicht bei unzureichenden Daten, wenn Hilfeleistung überwiegt — problematisch in Entscheidungsunterstützungsrollen.

4. IPO-Due-Diligence jetzt evaluierbar — [Finance Agent v2 erweitert](https://arxiv.org/abs/2606.23032) auf IPO-Szenarien über SEC-Filings hinaus. Benchmark für Anthropic Claude und OpenAI ChatGPT bei komplexeren Finanztasks mit verbessertem Retrieval-Ansatz.

5. SpaceX wird zur GPU-Cloud — [Latent Space Report](https://www.latent.space/p/ainews-spacex-is-already-a-28byr) dokumentiert drittes GPU-Rental-Deal für SpaceX (mit Reflection AI). Entwicklung zur $28B/Jahr-Infrastruktur für KI-Workloads.

### Modell-Updates

- Claude Code v2.1.187: Neue Sicherheitsfeatures — `sandbox.credentials` blockiert Sandboxed-Befehle vom Lesen von Credential-Dateien und Secret-Variablen. Organisationsweite Modell-Beschränkungen hinzugefügt.

- Claude Agent SDK TypeScript v0.3.187: Entsprechende Sicherheitsintegration für Sandbox-Credentials.

### Tool-Releases & Frameworks

- SHERLOC: Training-freier Localization-Framework für Code-Repair-Agenten — strukturierte Diagnosefindung statt nur File-Retrieval, spart 50% des Budgets durch bessere Fehlerlokalisation.

- VISTA-Benchmark: End-to-End-Evaluierung von Web-App-Generierung aus visuellen Specs — fokussiert auf UI-zentrische Entwicklung statt reine Algorithmus-Tasks.

- LemonHarness: Framework zur Workspace-State-Verwaltung bei mehrrundigen LLM-Agent-Tasks — explizite Grenzen für File-Operationen und Artifact-Management.

### Forschung

- Agentic Data Analysis Evaluation: [Studie zur Grader-Zuverlässigkeit](https://arxiv.org/abs/2606.24839) — automatische Bewertung von Multi-Output-Systemen (Code, Numerik, Diagnose) erfordert neue Metriken jenseits von End-to-End-Erfolg.

- Agent-Memory-Systeme: [Analyse von Datenverwaltung](https://arxiv.org/abs/2606.24775) — bisherige Evaluierungen unzureichend, echte Speicher-Features (Persistenz, Lifecycle-Governance) noch nicht systematisch gemessen.

- Agent-Definition kritisch hinterfragt: [Philosophische Analyse](https://arxiv.org/abs/2606.23991) trennt Automation von echter Agency — warnt vor unbegründeter "Agent"-Labelung von LLM-Tools.

- Transformer-Taxonomie: [Umfassende Review](https://arxiv.org/abs/2606.24331) von Anthropic, OpenAI, Mistral über Encoder-only bis Long-Context-Modelle.

### Business & Community

- Anthropic Account-Bans kontrovers: [HN-Thread](https://news.ycombinator.com/item?id=48641160) dokumentiert Claude-Code-Sperrungen wegen VPN-Nutzung bzw. Kartenduplikation — generische Support-Antworten ohne Lösungsweg.

---

Datengrundlage: Top 20 von 542 gesammelten Quellen mit Relevanz-Scores. Fokus auf methodische Fortschritte bei Agent-Evaluation, Security-Issues und Infrastruktur-Trends.
▶ Top Playbooks Alle Playbooks →
Bereiche