ذكاء اصطناعي · لغة·أبريل ٢٠٢٦·٨ دقائق قراءة

لماذا يفشل معظم بوتات الذكاء الاصطناعي العربية‏.

فيصل العنقودي · المؤسس · الرئيس التنفيذي

ليست المشكلة في النموذج. المشكلة أنّنا نُدرِّبه على عربيّة لا أحد يتكلّمها، ثمّ نندهش حين لا يفهمنا أحد.

في كلّ شهر تقريباً، يصلنا اتّصال من شركة عربيّة جرّبت بوتاً للذكاء الاصطناعي، ثمّ أوقفته بعد أسابيع. القصّة تتكرّر بنفس الشكل: استثمروا في حلٍّ جاهز، ربطوه بواتساب، وفتحوه للعملاء. خلال أيّام، انهالت الشكاوى. «البوت يردّ بعربيّة فصحى ثقيلة.» «لا يفهم اللهجة.» «يردّ بأشياء لا علاقة لها بالسؤال.» «العملاء يطلبون موظّفاً بشريّاً من أوّل رسالة.»

النتيجة دائماً واحدة: الشركة تعود إلى الردّ اليدويّ، وتقتنع بأنّ الذكاء الاصطناعي «ليس جاهزاً للعربيّة بعد». هذه القناعة خاطئة. الذكاء الاصطناعي جاهز. لكنّ الطريقة التي يُطبَّق بها على العربيّة، في معظم المنتجات الموجودة، خاطئة من الجذور.

السبب الأوّل: الفصحى ليست لغة المحادثة‏.

حين تُدرَّب النماذج الكبرى على «العربيّة»، فإنّها تُدرَّب فعليّاً على نصوص رسميّة: ويكيبيديا، أخبار، كتب، وثائق حكوميّة. هذه نصوص مكتوبة، لا منطوقة. حين يكتب عميل خليجيّ «أبغى أرجّع الطلب لأنّه ما يناسبني»، ويردّ البوت بـ «نعتذر عن عدم رضاكم، تفضّلوا بزيارة أقرب فرع لإتمام إجراءات الاسترجاع»، فإنّ شيئاً ما ينكسر في التجربة.

ليس الردّ خاطئاً. هو فقط ليس بشريّاً. اللهجة الخليجيّة ليست «نسخة أقلّ رسميّة» من الفصحى. هي طريقة تفكير مختلفة، وإيقاع جملة مختلف، ومفردات لا توجد أصلاً في القواميس.

اللهجة ليست تفصيلاً. هي التجربة كلّها.

السبب الثاني: نُدرِّب على ترجمات، لا على محادثات‏.

كثير من بيانات التدريب العربيّة المتاحة اليوم هي ترجمات آليّة من الإنجليزيّة. هذا يعني أنّ البوت تعلّم العربيّة من نصوص لم يكتبها عربيّ أصلاً. النتيجة: جُمل سليمة نحويّاً، لكنّها لا تُشبه ما يقوله الناس.

في نُقطة، نبني مجموعات بيانات حقيقيّة. نسجّل (بإذن) محادثات خدمة العملاء الفعليّة، ونعمل مع كاتبين عُمانيّين على إنشاء أمثلة جديدة باللهجة. الفرق ليس تقنيّاً، بل ثقافيّ: من يكتب البيانات، يكتب شخصيّة البوت.

السبب الثالث: السياق يُختصَر إلى رسالة واحدة‏.

أغلب البوتات تتعامل مع كلّ رسالة باعتبارها سؤالاً مستقلّاً. لكنّ المحادثة العربيّة، خاصّة في الخليج، لا تعمل هكذا. السلام، السؤال عن الحال، التمهيد، ثمّ الموضوع — كلّها جزء من السياق. البوت الذي يقفز مباشرة إلى «كيف يمكنني مساعدتك؟» يبدو فظّاً، حتّى لو كان دقيقاً.

نحفظ تاريخ المحادثة كاملاً، لا الرسالة الأخيرة فقط.
نعطي البوت معرفة بالوقت، الموقع، وتاريخ تعامل العميل مع الشركة.
ندرّبه على التمييز بين «سلام عليكم، عندي سؤال» و«عندي مشكلة الحين، الحلّ ضروريّ».

السبب الرابع: التكامل سطحيّ‏.

البوت الذي يردّ بمعلومات عامّة لا يحلّ مشكلة حقيقيّة. العميل يسأل «وين طلبي؟»، يحتاج البوت أن يقرأ من نظام الشحن، يعرف رقم الطلب من رقم الهاتف، ويعطي إجابة محدّدة. هذا تكامل، ليس ذكاءً اصطناعيّاً وحده.

معظم الحلول الجاهزة تتوقّف عند الطبقة اللغويّة. نحن نبني الطبقتين معاً: اللغة والتكامل. لأنّ بوتاً لا يستطيع قراءة بياناتك، هو موظّف استقبال جديد فقط.

السبب الخامس: لا أحد يقيس الفشل‏.

أخطر ما في البوتات السيّئة أنّها تفشل بصمت. العميل يسأل، البوت يردّ شيئاً غير مفيد، العميل يغادر. لا أحد يعرف. الشركة ترى أنّ «البوت ردّ على ١٠٠٠ رسالة هذا الشهر»، دون أن تعرف أنّ ٧٠٠ منها انتهت بعميل غاضب.

في كلّ منتج نطلقه، نبني لوحة قياس قبل البوت نفسه: نسبة المحادثات المُكتمَلة، نسبة التحويل إلى موظّف بشريّ، الأسئلة التي يفشل فيها البوت أكثر من مرّة. ما لا يُقاس، لا يتحسّن.

ماذا يعمل فعلاً؟

خلال السنتين الماضيتين، بنينا عشرات البوتات لشركات عُمانيّة وخليجيّة. الذي يعمل، دائماً، يتشارك في خمسة عناصر:

بيانات تدريب من المنطقة، لا ترجمات.
شخصيّة بوت محدّدة كتابيّاً قبل الكود (نسمّيها «دفتر الصوت»).
تكامل مع نظام واحد على الأقلّ يحلّ مشكلة فعليّة (طلب، حجز، فاتورة).
تحويل سلس وسريع لموظّف بشريّ حين يفشل البوت.
قياس أسبوعيّ للمحادثات، وإعادة تدريب شهريّة.

خلاصة‏.

الذكاء الاصطناعي العربيّ ليس مشكلة تقنيّة. هو مشكلة تصميم. النماذج موجودة، والبنية متاحة، والأدوات أرخص من أيّ وقت مضى. ما ينقصنا هو الجدّيّة في التعامل مع اللهجة، والصبر على بناء بياناتٍ حقيقيّة، والتواضع في القياس.

البوت الذي يردّ بلهجتك ليس ميزة. هو الحدّ الأدنى. وإن لم يكن متوفّراً، فالعميل سيقول لك ذلك بأوضح طريقة ممكنة: بصمته.