★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 28. Mai 2026
894 Artikel, 38 relevant
# KI-Tagesüberblick 2026-05-28
Highlights
1. Anthropic und OpenAI erreichen Profitabilität — Anthropic steht laut Gerüchten vor dem ersten profitablen Quartal. Beide Unternehmen haben offenbar [Produkt-Markt-Fit gefunden](https://simonwillison.net/2026/May/27/product-market-fit/#atom-everything), was sich in hohen LLM-Ausgaben bei Enterprise-Kunden widerspiegelt.
2. CiteCheck: Erkennung von Zitations-Halluzinationen — [Neues Framework](https://arxiv.org/abs/2605.27700) von Anthropic, OpenAI und Google zur Verifizierung von wissenschaftlichen Zitaten in LLM-generierten Texten. Prüft sowohl Existenz als auch Metadaten-Treue von Referenzen.
3. KI-Agenten bei Robinhood — Der Neobroker ermöglicht es [KI-Agenten wie Claude, über MCP-Protokoll eigenständig Aktien zu handeln](https://the-decoder.de/neobroker-robinhood-laesst-ki-agenten-fuer-kunden-aktien-handeln-und-mit-kreditkarte-einkaufen/). FINRA warnt bereits vor neuen Risiken durch autonome Finanztransaktionen.
4. Umdenken bei Arbeitsplatz-Prognosen — [Sam Altman und Dario Amodei revidieren ihre KI-Apokalypse-Szenarien](https://the-decoder.de/vom-job-killer-zum-produktivitaets-booster-openai-und-anthropic-chefs-kassieren-i/) und positionieren KI nun als Produktivitäts-Booster statt Job-Killer.
5. Graph-of-Skills für Agenten-Skalierung — [Anthropic und OpenAI präsentieren](https://arxiv.org/abs/2604.05333) einen Ansatz zur Verwaltung von tausenden Agent-Skills durch abhängigkeitsbasiertes Retrieval statt vollständigem Context-Loading.
## Forschung
- [ATLAS: Langkontext-Benchmarking](https://arxiv.org/abs/2605.28079) — Neues Evaluations-Framework für Long-Context-Modelle mit längenabhängigen Capability-Profilen (Anthropic, Google)
- [LegalGraphRAG](https://arxiv.org/abs/2605.28120) — Multi-Agent Graph-RAG-System speziell für rechtliches Reasoning mit heterogenen Wissensgraphen
- [SpatialBench-Long](https://arxiv.org/abs/2605.28065) — Benchmark für End-to-End-Spatial-Biology-Reasoning von KI-Agenten (OpenAI, Google)
- [Chain-of-Thought Faithfulness](https://arxiv.org/abs/2605.27773) — Studie zur Frage, ob CoT-Reasoning von Modellen echte interne Mechanismen widerspiegelt oder nicht (Anthropic, OpenAI)
- [Persuasion-Framework für LLMs](https://arxiv.org/abs/2503.01829) — Evaluation von Persuasions-Effektivität und Anfälligkeit von Sprachmodellen (Anthropic, OpenAI, Meta)
- [DoRA: Domain-RAG-Assessment](https://arxiv.org/abs/2604.17943) — Benchmark-Framework für Spezialdomänen-QA in Defense-Dokumenten (Anthropic, OpenAI)
- [ClinConsensus](https://arxiv.org/abs/2603.02097) — Ärztlich kalibrierte Chinese-Medical-Benchmark mit 2.500 Fällen über 36 Fachbereiche
## Tool-Releases
- [Claude Code v2.1.153](https://github.com/anthropics/claude-code/releases/tag/v2.1.153) — Neue Git-LFS-Skip-Option, npm-Update-Hinweise, Terminal-Umgebungsvariablen (COLUMNS/LINES) für Status-Line-Commands
## Business & Märkte
- FINRA-Warnung vor autonomen Finanz-Agenten — Regulatoren stufen eigenständig handelnde KI-Agenten als neues Risikofeld ein
- Enterprise-LLM-Kosten steigen — Firmen berichten über überraschend hohe LLM-Rechnungen durch breite Mitarbeiter-Adoption von Claude und GPT-Produkten
---
Hinweis: Die Sammlung basiert auf 894 Artikeln/Updates; diese Übersicht konzentriert sich auf die 20 relevantesten Einträge.
Bereiche