الرجوع للصفحة الرئيسية|الذكاء الاصطناعي|عاجل٦ أبريل ٢٠٢٦

تشغيل نموذج Google Gemma 4 محلياً: دليل شامل باستخدام أدوات LM Studio و Claude Code

استكشف كيفية تشغيل نموذج Gemma 4 من Google محلياً باستخدام واجهة سطر الأوامر الجديدة من LM Studio ، مع الاستفادة من بنية Mixture-of-Experts لتحقيق أداء عالٍ.

تشغيل نموذج Google Gemma 4 محلياً: دليل شامل باستخدام أدوات LM Studio و Claude Code

النقاط الرئيسية

إطلاق LM Studio 0.4.0 مع واجهة سطر أوامر جديدة (lms) ومحرك llmster.
نموذج Google Gemma 4 26B-A4B يستخدم بنية Mixture-of-Experts لأداء فائق.
سرعة استدلال تصل إلى 51 رمزاً في الثانية على أجهزة Apple Silicon.
دعم كامل للسياق حتى 256 ألف رمز، والرؤية الحاسوبية، واستدعاء الأدوات.
إمكانية التقدير المسبق لاستهلاك الذاكرة قبل تشغيل النماذج لضمان استقرار النظام.

في خطوة تمثل تحولاً كبيراً في كيفية تفاعل المطورين مع نماذج الذكاء الاصطناعي، أطلقت LM Studio إصدارها 0.4.0 الذي جلب معه أدوات قوية مثل llmster وواجهة سطر الأوامر lms. هذا التطور يفتح آفاقاً جديدة لتشغيل نماذج متطورة مثل Google Gemma 4 محلياً على أجهزة الحاسوب الشخصية، وتحديداً أجهزة Mac التي تعتمد على شرائح Apple Silicon. بالنسبة للمطورين والمتحمسين، لم يعد الاعتماد على واجهات برمجة التطبيقات السحابية (Cloud APIs) الخيار الوحيد، حيث توفر الحلول المحلية فوائد ملموسة مثل غياب تكاليف الاستخدام، تعزيز الخصوصية، والقضاء على مشكلات الكمون في الشبكة. يعد نموذج Google Gemma 4، وتحديداً نسخة 26B-A4B ، محور اهتمام كبير بفضل معمارية "خليط الخبراء" (Mixture-of-Experts). في هذا التصميم، لا يتم تفعيل كامل المعلمات في كل عملية تمرير، بل يتم تفعيل جزء صغير فقط (حوالي 4 مليارات معلمة)، مما يسمح للنموذج بالعمل بكفاءة عالية على عتاد لا يمكنه عادةً التعامل مع نماذج ضخمة. عند اختباره على جهاز MacBook Pro بشريحة M4 Pro وذاكرة موحدة سعة 48 جيجابايت، أظهر النموذج سرعة توليد تصل إلى 51 رمزاً في الثانية، وهو أداء مذهل يجعله مناسباً جداً لمهام مثل مراجعة الأكواد البرمجية وصياغة النصوص. تأتي عائلة نماذج Gemma 4 في أربعة إصدارات متنوعة لتلائم مختلف احتياجات العتاد. تتضمن المجموعة نماذج "E" (مثل E2B و E4B) التي تستخدم تضمينات لكل طبقة (Per-Layer Embeddings) لتحسين الأداء على الأجهزة، وهي الوحيدة التي تدعم مدخلات الصوت. أما النموذج الكثيف بحجم 31 مليار معلمة، فيعتبر الأكثر قدرة، حيث حقق نتائج مبهرة في اختبارات MMLU Pro و AIME 2026. ومع ذلك، يظل طراز 26B-A4B هو الخيار الأمثل للاستخدام المحلي بسبب توازنه الفريد بين القوة واستهلاك الموارد. من الناحية التقنية، يمتلك نموذج 26B-A4B حوالي 128 خبيراً بالإضافة إلى خبير مشترك، مع تفعيل 8 خبراء فقط لكل رمز. هذا يعني أن كفاءة الاستدلال تقترب من نماذج أصغر حجماً بينما تقدم جودة تتفوق بمراحل. في اختبارات Elo ، حقق هذا النموذج نتيجة تقارب 1441، وهو ما يضعه في منافسة مباشرة مع نماذج ضخمة تتطلب مئات المليارات من المعلمات. بفضل هذا التصميم، يمكن للمستخدمين الاستفادة من ميزات مثل سياق يصل إلى 256 ألف رمز، دعم الرؤية الحاسوبية، والقدرة على استدعاء الأدوات، كل ذلك دون الحاجة إلى خوادم مكلفة. مع إصدار LM Studio 0.4.0، تغيرت البنية التحتية للبرنامج بشكل جذري. أصبح محرك الاستدلال llmster متاحاً كخدمة خلفية مستقلة، مما يعني إمكانية تشغيله بالكامل عبر واجهة سطر الأوامر lms. هذه الإضافة تلغي الحاجة إلى واجهة رسومية، مما يجعله مثالياً للاستخدام في خوادم بدون شاشة، أو في بيئات التطوير المستمر (CI/CD)، أو حتى للمطورين الذين يفضلون البيئة الطرفية. يتضمن الإصدار الجديد معالجة متوازية للطلبات، مما يسمح بتنفيذ مهام متعددة في وقت واحد بدلاً من الانتظار التسلسلي. عملية التثبيت أصبحت بسيطة للغاية عبر سطر واحد من الأوامر، سواء على Linux أو macOS أو Windows. بعد تشغيل الخادم (Daemon)، يمكن للمستخدمين تحميل النماذج مباشرة باستخدام أمر `lms get`، حيث يقوم النظام تلقائياً بتحديد المتغير الأنسب (مثل Q4_K_M) وتنزيله. كما يوفر النظام أدوات مدمجة لمراقبة الأداء، مثل خيار `--stats` الذي يعرض سرعة التوليد والوقت المستغرق للحصول على الرمز الأول، مما يتيح للمستخدمين قياس كفاءة إعداداتهم بدقة. تعد ميزة إدارة الذاكرة أحد أقوى جوانب LM Studio الجديدة. يوفر النظام أمراً لتقدير استهلاك الذاكرة بناءً على طول السياق المطلوب، مما يساعد في التخطيط للموارد قبل تحميل النموذج فعلياً. على سبيل المثال، يتطلب تشغيل النموذج بكامل سعة السياق (256 ألف رمز) حوالي 37.5 جيجابايت من الذاكرة، مما يترك مساحة كافية لنظام التشغيل والتطبيقات الأخرى على جهاز بذاكرة 48 جيجابايت. هذه المرونة تجعل من السهل تخصيص الأداء وفقاً للعتاد المتاح. في الختام، يمثل هذا التطور في الأدوات المحلية قفزة نوعية للمطورين. القدرة على تشغيل نماذج مثل Gemma 4 محلياً باستخدام واجهة سطر أوامر قوية تفتح الباب أمام تطبيقات ذكاء اصطناعي أكثر خصوصية وأماناً. سواء كنت تقوم بتطوير أدوات برمجية أو تجربة نماذج جديدة، فإن التوليفة بين LM Studio و Claude Code توفر بيئة عمل فعالة واقتصادية تتجاوز قيود الخدمات السحابية التقليدية.

ثورة Mixture-of-Experts في النماذج المحلية

تعتمد فعالية نموذج Gemma 4 26B-A4B على معمارية خليط الخبراء التي توازن بذكاء بين الأداء واستهلاك الموارد. من خلال تنشيط جزء صغير فقط من المعلمات، يوفر النموذج سرعة استجابة عالية دون الحاجة إلى عتاد خوادم ضخم. هذا التصميم يسمح للمستخدمين بتشغيل نماذج ذات قدرات استدلالية تضاهي النماذج التي تتطلب مئات المليارات من المعلمات، مما يجعلها مثالية للاستخدام على أجهزة الحاسوب المحمولة القوية.

مرونة LM Studio 0.4.0 للمطورين

يمثل الإصدار 0.4.0 من LM Studio نقلة نوعية من خلال توفير واجهة سطر أوامر شاملة. لم يعد المطورون مقيدين بالواجهات الرسومية، بل يمكنهم الآن أتمتة مهام الذكاء الاصطناعي ودمجها في بيئات العمل البرمجية. تتيح ميزات مثل المعالجة المتوازية وتقدير الذاكرة للمستخدمين تحكماً كاملاً في كيفية عمل النماذج، مما يضمن أفضل أداء ممكن بناءً على المواصفات المتاحة لكل جهاز.

صيغ هذا المقال بمساعدة الذكاء الاصطناعي وروجِع تحريريًا قبل النشر. المصادر مذكورة أدناه.

عن الكاتب

عبدالله الجاسر

المؤسس

مهندس صناعي | مؤسس منصة نيوزلي | شغوف بالتقنية والذكاء الاصطناعي

كل مقالات الكاتب

المصادر

George Liu's Tech Blog