السعودية تطلق أول منصة وطنية للبيانات الضخمة لتدريب نماذج الذكاء الاصطناعي باللغة العربية
أطلقت السعودية أول منصة وطنية للبيانات الضخمة لتدريب نماذج الذكاء الاصطناعي باللغة العربية، تضم أكثر من 100 مليار كلمة، بهدف سد الفجوة الرقمية العربية.
أطلقت السعودية أول منصة وطنية للبيانات الضخمة لتدريب نماذج الذكاء الاصطناعي باللغة العربية، تحتوي على أكثر من 100 مليار كلمة من مصادر متنوعة.
السعودية تطلق منصة وطنية للبيانات الضخمة تحتوي على 100 مليار كلمة عربية لتدريب نماذج الذكاء الاصطناعي، مما يعزز المحتوى العربي الرقمي ويدعم رؤية 2030.
📌 النقاط الرئيسية
- ✓أول منصة وطنية للبيانات الضخمة بالعربية لتدريب نماذج الذكاء الاصطناعي.
- ✓تحتوي على أكثر من 100 مليار كلمة عربية من مصادر متنوعة.
- ✓متاحة للباحثين والشركات محلياً ودولياً.
- ✓تساهم في تحقيق رؤية 2030 وتعزيز الاقتصاد الرقمي.

في خطوة رائدة نحو تعزيز مكانة المملكة كمركز عالمي للذكاء الاصطناعي، أطلقت السعودية أول منصة وطنية للبيانات الضخمة مخصصة لتدريب نماذج الذكاء الاصطناعي باللغة العربية. تأتي هذه المبادرة ضمن جهود تحقيق رؤية 2030، وتهدف إلى سد الفجوة في المحتوى العربي الرقمي، حيث تشير الإحصائيات إلى أن المحتوى العربي لا يتجاوز 3% من إجمالي المحتوى على الإنترنت، رغم أن العرب يشكلون 5% من سكان العالم.
ما هي المنصة الوطنية للبيانات الضخمة السعودية؟
المنصة الوطنية للبيانات الضخمة هي مبادرة من الهيئة السعودية للبيانات والذكاء الاصطناعي (SDAIA) تهدف إلى جمع وتنظيم وتوفير مجموعات ضخمة من البيانات باللغة العربية لتطوير نماذج ذكاء اصطناعي أكثر دقة وفهماً للسياق العربي. تشمل البيانات نصوصاً وصوراً وفيديوهات ومقاطع صوتية من مصادر متنوعة مثل الكتب والمقالات ووسائل التواصل الاجتماعي. تعمل المنصة على تسريع الابتكار في مجالات مثل الترجمة الآلية وتحليل المشاعر والتحدث بالعربية.
كيف ستعمل المنصة على تطوير الذكاء الاصطناعي العربي؟
ستوفر المنصة بيئة آمنة ومتكاملة للباحثين والشركات الناشئة والجهات الحكومية لتدريب نماذجهم باستخدام بيانات عالية الجودة. تشمل الخدمات أدوات معالجة البيانات وتصنيفها، بالإضافة إلى خوارزميات جاهزة للتدريب. يمكن للمستخدمين الوصول إلى مجموعات بيانات ضخمة تحتوي على أكثر من 100 مليار كلمة عربية، مما يمثل قفزة نوعية مقارنة بالمكتبات الحالية. كما ستدعم المنصة تطوير نماذج متعددة الوسائط (multimodal) تجمع بين النص والصوت والصورة.
لماذا تعتبر هذه المنصة ضرورية للعالم العربي؟
تعاني نماذج الذكاء الاصطناعي الحالية من تحيز واضح ضد اللغة العربية، حيث أن معظم البيانات التدريبية هي باللغة الإنجليزية. هذا يؤدي إلى ضعف الأداء في مهام مثل فهم اللهجات المختلفة والترجمة الدقيقة. المنصة الجديدة ستوفر بيانات تغطي اللهجات العربية المختلفة (المصرية، الخليجية، المغربية، إلخ) مما سيمكن من تطوير تطبيقات أكثر شمولية. وفقاً لتقرير صادر عن SDAIA، فإن الاستثمار في الذكاء الاصطناعي العربي يمكن أن يضيف 320 مليار دولار إلى الاقتصاد السعودي بحلول 2030.
هل ستكون المنصة متاحة للجميع؟
نعم، المنصة ستكون متاحة للباحثين والشركات الناشئة والمؤسسات الأكاديمية داخل المملكة وخارجها، مع وجود طبقات وصول مختلفة. ستكون بعض البيانات مجانية، بينما تتطلب بيانات متخصصة اشتراكات مدفوعة. كما ستوفر المنصة بيئة حوسبة سحابية (cloud computing) قوية لتدريب النماذج دون الحاجة لبنية تحتية ضخمة. هذا النموذج يشبه منصات مثل Kaggle لكن مع تركيز على البيانات العربية.
متى سيتم إطلاق المنصة رسمياً؟
تم الإعلان عن المنصة خلال مؤتمر القمة العالمي للذكاء الاصطناعي في الرياض في مايو 2026، ومن المتوقع أن تبدأ المرحلة التجريبية في يوليو 2026، على أن يتم الإطلاق الكامل في سبتمبر 2026. ستشمل المرحلة الأولى 5000 مستخدم من 20 دولة، مع خطط للتوسع لتشمل 100 ألف مستخدم بحلول 2027.
ما هي التحديات التي تواجه المنصة؟
تواجه المنصة عدة تحديات، أبرزها جودة البيانات وتنوعها، حيث أن البيانات العربية المتاحة غالباً ما تكون غير منظمة أو تحتوي على أخطاء. كما أن حماية الخصوصية والأمان تمثل تحدياً كبيراً، خاصة عند التعامل مع بيانات حساسة. بالإضافة إلى ذلك، تحتاج المنصة إلى جذب خبراء في معالجة اللغة العربية الطبيعية (NLP) الذين يندر وجودهم. تعمل SDAIA على معالجة هذه التحديات من خلال التعاون مع جامعات عالمية مثل جامعة الملك عبد الله للعلوم والتقنية (KAUST).
إحصائيات رئيسية حول المنصة
- تحتوي المنصة على أكثر من 100 مليار كلمة عربية من مصادر متنوعة.
- من المتوقع أن تساهم في زيادة المحتوى العربي الرقمي بنسبة 50% خلال 5 سنوات.
- ستدعم المنصة تطوير 1000 نموذج ذكاء اصطناعي عربي بحلول 2028.
- تقدر قيمة سوق الذكاء الاصطناعي في السعودية بـ 30 مليار ريال (8 مليارات دولار) بحلول 2030.
- تخطط SDAIA لتدريب 10 آلاف خبير في الذكاء الاصطناعي خلال 3 سنوات.
في الختام، تمثل المنصة الوطنية للبيانات الضخمة نقلة نوعية في مسيرة الذكاء الاصطناعي العربي، حيث ستوفر البنية التحتية اللازمة لتطوير نماذج تفهم اللغة العربية بكل تنوعاتها. مع الدعم الحكومي القوي والشراكات الدولية، من المتوقع أن تصبح السعودية مركزاً عالمياً للذكاء الاصطناعي العربي، مما يعزز مكانتها كقائد إقليمي في هذا المجال الحيوي.
الكيانات المذكورة
كلمات دلالية
هل وجدت هذا المقال مفيداً؟ شاركه مع شبكتك.



