السعودية تطلق أول نموذج لغوي عربي ضخم مفتوح المصدر لمنافسة GPT-4 بدعم من صندوق الاستثمارات العامة
السعودية تطلق أول نموذج لغوي عربي ضخم مفتوح المصدر (SAM) بقدرات تنافسية مع GPT-4، بدعم من صندوق الاستثمارات العامة، لتعزيز السيادة الرقمية وتحقيق رؤية 2030.
أطلقت السعودية أول نموذج لغوي عربي ضخم مفتوح المصدر (SAM) بقدرات تنافسية مع GPT-4، بدعم من صندوق الاستثمارات العامة، مما يعزز السيادة الرقمية للمملكة.
أطلقت السعودية أول نموذج لغوي عربي ضخم مفتوح المصدر (SAM) بقدرات تنافسية مع GPT-4، بدعم من صندوق الاستثمارات العامة، لتعزيز السيادة الرقمية وتحقيق رؤية 2030.
📌 النقاط الرئيسية
- ✓إطلاق أول نموذج لغوي عربي ضخم مفتوح المصدر (SAM) بـ175 مليار معامل.
- ✓النموذج يتفوق على GPT-4 في فهم اللغة العربية بنسبة 12%.
- ✓دعم صندوق الاستثمارات العامة بتكلفة 500 مليون ريال.
- ✓متاح مجاناً للمطورين عبر رخصة Apache 2.0.
- ✓يُتوقع أن يُحدث ثورة في تطبيقات الذكاء الاصطناعي العربية.

في خطوة تاريخية تعزز مكانة المملكة العربية السعودية كمركز عالمي للذكاء الاصطناعي، أطلقت السعودية أول نموذج لغوي عربي ضخم مفتوح المصدر (Arabic Large Language Model) بقدرات تنافسية مع GPT-4، وذلك بدعم من صندوق الاستثمارات العامة (PIF). النموذج الجديد، الذي يحمل اسم "سام" (SAM)، يُعد الأول من نوعه في العالم العربي، ويهدف إلى تمكين المطورين والشركات من بناء تطبيقات ذكاء اصطناعي متقدمة باللغة العربية دون الحاجة لترخيص تجاري، مما يعزز السيادة الرقمية للمملكة ويُسهم في تحقيق مستهدفات رؤية 2030.
ما هو النموذج اللغوي العربي الضخم "سام"؟
النموذج اللغوي "سام" (SAM اختصاراً لـ Saudi Arabic Model) هو نظام ذكاء اصطناعي توليدي مدرب على أكثر من 1.5 تريليون رمز (token) من النصوص العربية الفصحى والعامية، بالإضافة إلى محتوى إنجليزي. يتميز النموذج بـ 175 مليار معامل (parameter)، مما يجعله من بين أكبر النماذج اللغوية المفتوحة المصدر في العالم. تم تدريبه باستخدام 10,000 وحدة معالجة رسومية (GPU) من نوع NVIDIA H100 في مركز بيانات تابع لشركة data-volt في الرياض، بتكلفة إجمالية تجاوزت 500 مليون ريال سعودي.
كيف تم تطوير النموذج ومن يقف وراءه؟
تم تطوير "سام" بالتعاون بين الهيئة السعودية للبيانات والذكاء الاصطناعي (SDAIA) وشركة "إي آي سي" (AIC) التابعة لصندوق الاستثمارات العامة. استغرق التدريب 6 أشهر بمشاركة فريق من 200 مهندس وعالم بيانات سعودي، بالاستعانة بخبرات دولية من شركات مثل مايكروسوفت (Microsoft) وإنفيديا (NVIDIA). يُعد المشروع جزءاً من استراتيجية المملكة الوطنية للذكاء الاصطناعي التي أطلقتها SDAIA في 2020، والتي تهدف إلى جعل السعودية ضمن أفضل 10 دول في مجال الذكاء الاصطناعي بحلول 2030.
لماذا يُعد النموذج مفتوح المصدر؟
اختيار المصدر المفتوح (open-source) جاء لعدة أسباب استراتيجية: أولاً، تشجيع الابتكار المحلي وتمكين الشركات الناشئة والمطورين من استخدام النموذج دون قيود ترخيص. ثانياً، بناء مجتمع عربي للمساهمة في تطوير النموذج وتحسين أدائه. ثالثاً، تعزيز الشفافية والثقة في تقنيات الذكاء الاصطناعي. النموذج متاح للتحميل عبر منصة Hugging Face، ورخصة الاستخدام هي Apache 2.0، مما يسمح بالاستخدام التجاري وغير التجاري.
هل يمكن للنموذج منافسة GPT-4؟
وفقاً لنتائج الاختبارات الداخلية التي أجرتها SDAIA، تفوق "سام" على GPT-4 في مهام فهم اللغة العربية (Arabic language understanding) بنسبة 12%، خاصة في مجالات الترجمة الآلية وتحليل المشاعر واستخراج المعلومات. كما سجل أداءً متقارباً في المهام العامة مثل التلخيص والإجابة عن الأسئلة. ومع ذلك، لا يزال GPT-4 يتفوق في المهام متعددة اللغات والمحتوى الإبداعي الطويل. يُخطط لتحديث النموذج بشكل دوري لسد الفجوة.
ما هي التطبيقات المحتملة للنموذج؟
يمكن استخدام "سام" في مجموعة واسعة من التطبيقات، منها: روبوتات المحادثة (chatbots) للخدمات الحكومية والبنوك، أنظمة الترجمة الفورية، أدوات تحليل النصوص القانونية والطبية، المساعدين الصوتيين باللهجات العربية، وتوليد المحتوى التعليمي والترفيهي. أعلنت وزارة التعليم السعودية بالفعل عن شراكة مع SDAIA لاستخدام النموذج في تطوير منصة تعليمية ذكية تستهدف 6 ملايين طالب.
متى سيتم إطلاق النموذج تجارياً؟
تم الإطلاق التجريبي للنموذج في 29 مايو 2026، مع إتاحة واجهة برمجة تطبيقات (API) مجانية للمطورين المسجلين. يُتوقع الإطلاق التجاري الكامل في الربع الثالث من 2026، مع خطط لطرح خدمات مدفوعة عبر الحوسبة السحابية (cloud computing) بأسعار تنافسية. كما تعتزم SDAIA إطلاق نسخة محسنة من النموذج (SAM-2) بحلول نهاية 2027.
ما هي التحديات التي تواجه النموذج؟
رغم النجاح الكبير، يواجه "سام" تحديات أبرزها: ندرة البيانات العربية عالية الجودة في بعض المجالات المتخصصة مثل الطب والهندسة، الحاجة إلى تحسين الأداء في اللهجات العامية الخليجية والمغاربية، ومخاطر التحيز (bias) في المخرجات. تعمل SDAIA على معالجة هذه التحديات عبر إطلاق شراكات مع جامعات سعودية ودولية، وتطوير أدوات لتصحيح التحيز.
إحصائيات رئيسية
- 1.5 تريليون رمز تدريبي (token) مستخدمة في تدريب النموذج.
- 175 مليار معامل (parameter) تجعل النموذج الأكبر عربياً.
- 500 مليون ريال سعودي إجمالي تكلفة التطوير.
- 10,000 وحدة معالجة رسومية (GPU) من نوع NVIDIA H100.
- 200 مهندس وعالم بيانات سعودي شاركوا في المشروع.
خاتمة
يُعد إطلاق النموذج اللغوي العربي "سام" نقلة نوعية في مسيرة التحول الرقمي السعودي، ويعزز مكانة المملكة كمنافس عالمي في مجال الذكاء الاصطناعي. بفضل دعم صندوق الاستثمارات العامة والتعاون مع شركات تقنية كبرى، يُتوقع أن يُسهم النموذج في تسريع وتيرة الابتكار في العالم العربي، وفتح آفاق جديدة للصناعات القائمة على اللغة. مع خطط التطوير المستقبلية، قد نرى قريباً نموذجاً عربياً يتصدر المشهد العالمي في الذكاء الاصطناعي التوليدي.
الكيانات المذكورة
كلمات دلالية
هل وجدت هذا المقال مفيداً؟ شاركه مع شبكتك.



