← Alle Begriffe konzept

Embedding (Vektor-Einbettung)

Eine mathematische Darstellung von Text als Zahlenreihe — ermoeglicht semantische Suche und RAG.

Erklaerung

Ein Embedding wandelt Text in einen Vektor (eine Liste von Zahlen) um, der die Bedeutung des Textes repraesentiert. Aehnliche Texte haben aehnliche Vektoren. Damit kann man semantisch suchen: 'Wie kuendige ich meinen Vertrag?' findet auch Dokumente die 'Vertragsbeendigung' oder 'Kuendigungsfrist' enthalten — ohne dass diese Woerter im Suchbegriff vorkommen. Gaengige Modelle: OpenAI text-embedding-3-small (1536 Dimensionen), Ollama mit nomic-embed-text (lokal). Gespeichert in Vektor-Datenbanken wie pgvector (Supabase), Pinecone oder Weaviate.

Beispiel

Der Satz 'Der Arzt verschreibt ein Medikament' und 'Ein Mediziner gibt eine Verordnung' haben aehnliche Embedding-Vektoren obwohl kein einziges Wort identisch ist — weil die Bedeutung aehnlich ist.

Verwandte Begriffe

rag llm corporate-llm