تخطَّ إلى المحتوى
العودة إلى الأعمال
ذكاء اصطناعي2025

روبوت محادثة RAG مخصّص

روبوت محادثة معزّز بالاسترجاع يعمل على نموذج Mistral-7B مُستضاف محليًا باستدلال مُسرَّع بكرت الرسوميات، مستندًا إلى قاعدة معرفة منسَّقة ومُقدَّمًا عبر واجهة ويب مخصّصة.

المشكلة

النماذج اللغوية العامة لا تعرف سياقك الخاص، وإرسال البيانات الخاصة إلى واجهات مُستضافة ليس مقبولًا دائمًا. أردتُ روبوتًا يجيب من قاعدة معرفة محكومة بينما يعمل بالكامل على عتاد محلّي.

المعالجة

شغّلتُ Mistral-7B-Instruct محليًا باستدلال مُسرَّع على كرت RTX 3060 Ti، وبنيتُ خطوة استرجاع تحقن السياق المناسب في كل مُوجَّه، وغلّفتُها بواجهة Flask. وأتاحت واجهة ويب مخصّصة، مكشوفة على الإنترنت عبر Cloudflare، استخدامه من أي مكان مع بقاء النموذج على العتاد المحلّي.

دوري

مشروع فرديّ — تصميم الاسترجاع، وبناء المُوجَّهات، وواجهة Flask، واستضافة النموذج محليًا، والنشر.