ما هو RAG — ولماذا بوت شركتك لا يفهم سياق عملك.
فيصل العنقودي · المؤسس والرئيس التنفيذي
دليل عملي لـ Retrieval-Augmented Generation: كيف يقرأ البوت مستنداتك قبل أن يجيب، ولماذا هو أرخص من Fine-tuning بعشر مرات.
في اجتماع تسويق الأسبوع الماضي، وقف أحد المديرين أمام شريحة فيها منحنى أزرق يصعد: «زيادة في مرات الظهور». ثم سُئل سؤال واحد من المالية: «هل زادت المبيعات؟» فصار المنحنى حيادياً.
السؤال لم يكن ظالماً. لقد تغيّر ما يعنيه «البحث» للمستخدم قبل أن يتغيّر عقد إعلاناتك. حين نتحدث عن نهاية عصر البحث التقليدي وما يحدث لـ Google في ٢٠٢٦، نحن لا نتنبأ بانهيار شركة بين ليلة وضحاها. نصف انتقال السلطة من صفحة روابط إلى سطح إجابة: أسرع للمستخدم، أشدّ إثارة للمنافسة، وأكثر تعقيداً لأي فريق يقيس الأثر بالظهور وحده.
ما هو RAG — الاسترجاع قبل التوليد.
RAG اختصار Retrieval-Augmented Generation، أو التوليد المعزّز بالاسترجاع [١]. المعنى العملي: البوت يقرأ مستنداتك قبل أن يجيب. لا يحفظها. يسترجعها.
النموذج اللغوي الكبير (LLM) يعرف كيف يتحدث. لكنه لا يعرف شيئاً عن عقودك، ولا عن أسعارك، ولا عن لائحة موظفيك الداخلية. RAG يضيف له ذاكرة خارجية: قاعدة بيانات مستندات تُبحث فيها الأسئلة قبل التوليد. النتيجة: إجابة تستند إلى مستند حقيقي، لا إلى تخمين عام [٢].
الفرق بين RAG و Fine-tuning — إطار قرار لا مقارنة تقنية.
Fine-tuning يعني إعادة تدريب النموذج على بياناتك. يكلف عشرات الآلاف من الدولارات. ويحتاج أسابيع. ويُنتج نموذجاً ثابتاً: إذا غيّرت عقدك الشهر المقبل، النموذج لا يعرف. يجب أن تُعيد التدريب [٣].
RAG يعني ترك النموذج كما هو، وربطه بمستودع مستندات. التكلفة أقل بعشر مرات. التحديث فوري: تبدّل العقد؟ يكفي أن ترفع الملف الجديد. البوت يقرأه في نفس اللحظة [٤].
Fine-tuning يُعلّم النموذج كيف يتحدث بلهجتك. RAG يُعطيه ما يقوله من مستنداتك. معظم الشركات العربية تحتاج RAG، لا Fine-tuning.
أنابيب RAG في عُمان — كيف نبنيه فعلاً.
في نُقطة، نبني RAG لعملائنا في مسقط بأربع مراحل: استخراج النصوص من PDF و Word وExcel، تقسيم المستندات إلى قطع صغيرة (chunks)، تحويل القطع إلى متجهات (embeddings) باستخدام نموذج عربي، ثم البحث الدلالي (semantic search) + توليد الإجابة [٥].
المرحلة الثالثة هي العمود الفقري. النموذج العربي يقرأ كل قطعة مستند ويحوّلها إلى متجه رياضي. حين يسأل موظف السؤال، يُحوّل السؤال إلى متجه، ثم يبحث في قاعدة البيانات عن أقرب متجهات. النتيجة: مستندات ذات صلة دقيقة، حتى لو السؤال لم يستخدم نفس الكلمات.
التكلفة الواقعية — ليس رخيصاً، لكنّه أرخص من Fine-tuning بعشر مرات.
على بنية خاصة في مسقط (Private AI)، تكلفة تشغيل RAG لشركة متوسطة: خادم CPU للاستخراج والتقسيم موجود أصلاً. GPU صغير للـ embeddings: NVIDIA T4 أو A10، تكلفة تأجير شهرية ~٤٠٠–٨٠٠ دولار [٦]. قاعدة بيانات المتجهات: Qdrant أو Chroma، مجانية أو بسعر رمزي. النموذج اللغوي: يُشغّل على نفس GPU أو يُستدعى عبر API داخلي.
المجموع: أقل من ألف دولار شهرياً. مقارنة بـ Fine-tuning الذي يكلف عشرة آلاف دولار لمرة واحدة، ثم يحتاج إعادة كل شهر [٣].
الصدقية: RAG ليس سحراً.
لا تُصدّق من يقول لك البوت يعرف كل شيء الآن. RAG يفشل في ثلاث حالات واضحة: المستندات غير منظمة، الأسئلة خارج نطاق المستندات، واللغة العربية الدارجة [٧].
معظم نماذج الـ embeddings تفهم العربية الفصحى، لكنها تتعثر في اللهجة العُمانية الدارجة. نحن في نُقطة نختبر نماذج عربية محلية لحل هذه المشكلة.
الدعوة.
إذا كنت تبني بوتاً داخلياً لشركتك في مسقط أو الرياض أو دبي، لا تبدأ بالنموذج. ابدأ بالمستندات. اجلس مع فريقك وسأل: ما هي العشرة مستندات التي يُجيب عنها موظفونا آلاف المرات سنوياً؟ هذه هي بداية RAG. الباقي تقنية نبنيه لك.
إن أردت تقييماً حقيقياً لبنية RAG تناسب شركتك — لا عرض سعر، لا عقد — اكتب لنا على hello@nuqtai.com. نجلس ساعة، نراجع مستنداتك، ونعطيك خارطة طريق.
أسئلة شائعة.
ما الفرق بين RAG وقاعدة البيانات العادية؟ قاعدة البيانات العادية تبحث بالكلمات المفتاحية. RAG يبحث بالمعنى. إذا سألت: كم تكلفة الشحنة الثقيلة؟ قاعدة البيانات قد تفشل إذا لم تكن كلمة ثقيلة في السجل. RAG يفهم أن ثقيلة قريبة من حاوية ٤٠ قدماً ويسترجع السجل الصحيح [٤].
هل RAG يحتاج إلى إنترنت؟ لا. يمكن تشغيله بالكامل على خوادم داخلية في عُمان. هذا ما نبنيه في نُقطة تحت اسم Private AI. بياناتك لا تخرج من تحت سيطرتك [٧].
كم عدد المستندات اللازمة لـ RAG؟ لا يوجد حد أدنى. بدأنا بـ ٥٠ صفحة لعميل واحد. لكن الجودة أهم من الكمية. مستند واحد واضح أفضل من ألف صفحة مشوشة.
هل يمكن ربط RAG بـ WhatsApp Business API؟ نعم. هذا بالضبط ما نفعله في منتج الذكي. العميل يرسل سؤالاً عبر واتساب، والبوت يبحث في مستندات الشركة ويُجيب بلهجة خليجية [٨].
كم يستغرق بناء RAG؟ من أربعة إلى ثمانية أسابيع لبنية أولى تعمل. لكن النسخة التي تُطلق للموظفين — بعد الاختبار الداخلي — قد تحتاج أسبوعين إضافيين.
مقالات ذات صلة
- البحث الهجين — الجمع بين البحث النصي والمتجهي.
هذا ليس اسم منتج على بطاقة. هذا قرار بنية: متى يحميك التطابق على الكلمات، ومتى يحميك التشابه في فضاء المتجهات، وكيف تدمجهما دون أن تضاعف التكلفة بلا مقياس.
- ما هو نموذج اللغة الكبير — دليل كامل لعام ٢٠٢٦.
هذا ليس مقال تعريفات. هذا حساب قرار. إذا أردت استخدام نموذج لغة كبير في ٢٠٢٦، فهذه هي الصورة كاملة: كيف يعمل، أين يربح، أين يخذلك، وكيف تختار دون ضجيج.
- ما هو الـ Fine-tuning ولماذا يختلف عن الـ Prompting.
في نصف الاجتماعات يُقال «سنُحسّن النموذج» بينما المقصود «سنعيد صياغة الجملة». الطرفان مكملان، لكنّ أحدهما يغيّر النص الذي يدخل، والآخر قد يغيّر أوزان النموذج نفسه. هذا الفصل يوضّح القرار ويحميك من دفع تكلفة التدريب دون حاجة.
- لماذا يفشل معظم بوتات الذكاء الاصطناعي العربية.
ليست المشكلة في النموذج. المشكلة أنّنا نُدرِّبه على عربيّة لا أحد يتكلّمها، ثمّ نندهش حين لا يفهمنا أحد.
- الفرق بين GPT-4 وClaude وGemini — مقارنة موضوعية.
هذا ليس تصويتاً جماهيرياً. هذا إطار قرار: ما الذي يميّز كل عائلة، أين تتقدّم، وأين تضعف، وكيف تختار دون أن يبيعك أحد وهم «الأفضل».