Μετάβαση στο περιεχόμενο
Symbols

Γλωσσάρι · Τεχνητή Νοημοσύνη

RAG (Retrieval-Augmented Generation)

Retrieval-Augmented Generation. Τεχνική όπου το AI ψάχνει πρώτα σε γνωστά δεδομένα και μετά παράγει απάντηση. Αποφεύγει hallucinations.

Επίσης γνωστό ως: retrieval augmented generation

Αναλυτικά

Το RAG (Retrieval-Augmented Generation) είναι τεχνική όπου ένα LLM:

  1. Αναζητάει πρώτα σε εξωτερική βάση γνώσης (vector database) τα σχετικά κομμάτια κειμένου.
  2. Παράγει απάντηση βασισμένη στα κομμάτια που βρήκε, όχι μόνο στη γνώση που έχει εκπαιδευθεί.

Είναι ο τρόπος με τον οποίο φτιάχνετε chatbot/agent που ξέρει τα δικά σας δεδομένα — εταιρικά docs, FAQs, product catalog, internal knowledge.

Πώς δουλεύει βήμα-βήμα

  1. Indexing. Όλα τα έγγραφά σας (PDFs, web pages, Notion) σπάνε σε chunks (~500 tokens).
  2. Embedding. Κάθε chunk μετατρέπεται σε vector — ένας πίνακας αριθμών που αντιπροσωπεύει το νόημα.
  3. Storage. Τα vectors αποθηκεύονται σε vector database (Pinecone, Weaviate, pgvector, Qdrant).
  4. Query time. Όταν ο χρήστης ρωτήσει, η ερώτηση γίνεται κι αυτή vector.
  5. Retrieval. Βρίσκουμε τα top-5 chunks με τη μεγαλύτερη similarity.
  6. Generation. Δίνουμε στο LLM την ερώτηση + τα 5 chunks και παράγει απάντηση.

Γιατί δουλεύει καλύτερα από fine-tuning

  • Φθηνότερο. Δεν χρειάζεται custom training.
  • Επικαιροποιείται γρήγορα. Νέα δεδομένα = re-index των αλλαγμένων chunks.
  • Source citations. Μπορείτε να δείξετε από πού προήλθε κάθε απάντηση.
  • Λιγότερα hallucinations. Το LLM «βλέπει» τα δεδομένα — δεν τα μαντεύει.

Πότε χρειάζεστε RAG

✅ Όταν έχετε proprietary content που το AI πρέπει να ξέρει. ✅ Όταν τα δεδομένα σας αλλάζουν συχνά (νέα policies, νέα products). ✅ Όταν χρειάζεστε source attribution για compliance.

Πότε δεν χρειάζεστε RAG

❌ Όταν η γνώση είναι ευρέως γνωστή και ήδη στην training data του LLM. ❌ Για απλά FAQ <100 ερωτήσεων — μπείτε τα όλα στο system prompt.

Πλατφόρμες (2026)

  • LangChain / LlamaIndex — open-source RAG frameworks.
  • Pinecone — managed vector DB.
  • Supabase pgvector — Postgres-based, simple.
  • OpenAI Assistants API — built-in RAG, λίγο customization.

Δείτε AI Knowledge Base.

Δείτε επίσης

Έτοιμοι να ξεκινήσουμε;

Πες μας λίγα λόγια για το έργο σου. Θα σου στείλουμε σταθερή προσφορά σε 24 ώρες.