ما الذي يجعل M3 مختلفًا
يتمتع النظام البيئي ذو الوزن المفتوح تاريخياً بالقدرة على إمكانية الوصول. يمكنك تشغيل نموذج محليًا، لكنك ضحيت بطول السياق أو كفاءة البرمجة أو الدعم متعدد الوسائط. يكسر MiniMax M3 هذه المقايضة عبر ثلاثة أبعاد.
1. مليون عملة، وليس مليون دولار
الميزة الرئيسية هي نافذة سياق الرمز المميز التي تبلغ 1 مليون الخاصة بـ M3 - وهي كافية لاستيعاب قاعدة تعليمات برمجية كاملة، أو رواية كاملة، أو مئات الصفحات من المستندات القانونية والتقنية في تمريرة واحدة. وما يجعل هذا الأمر مثيرًا للإعجاب حقًا هو الطريقة التي حققت بها MiniMax ذلك.
طورت الشركة آلية انتباه جديدة تسمى MiniMax Sparse Attention (MSA) تتجنب وباء التعقيد التربيعي للانتباه الكامل القياسي. بدلاً من مقارنة كل رمز مميز بكل رمز مميز آخر - دوامة الموت O(n²) التي تجعل السياقات الطويلة باهظة من الناحية الحسابية - تقوم MSA بتقسيم ذاكرة التخزين المؤقت KV إلى كتل، ومرشحات مسبقة للملاءمة، ومعالجة الكتل المهمة فقط.
والنتيجة صارخة: عند طول سياق يبلغ مليون رمز مميز، تنخفض تكلفة حساب كل رمز مميز لـ M3 إلى 1/20 من سابقتها. معالجة الإدخال أسرع بـ 9 مرات. توليد الاستجابة أسرع 15×. ومن خلال دراسات الاستئصال المكثفة، يطابق MSA الاهتمام الكامل بالغالبية العظمى من القدرات.
2. البرمجة التي تتنافس مع الشركات العملاقة المملوكة
في SWE-Bench Pro، وهو معيار هندسة البرمجيات المتوافق مع معايير الصناعة، حصل M3 على 59.0% — متجاوزًا GPT-5.5 وGemini 3.1 Pro، ويأتي خلف Anthropic's Opus 4.7 مباشرةً. عبر مجموعة المعايير الأوسع، كانت النتائج متسقة:
- المحطة الطرفية 2.1: 66.0%
- أطلس MCP: 74.2%
- BrowseComp: 83.5 (قبل Opus 4.7)
- SVG-Bench: يفوق Opus 4.7
لم يتوقف MiniMax عند المعايير الثابتة. قام الفريق ببناء إطار عمل محاكاة مستخدم تفاعلي يعرض النموذج لأنماط التعاون في العالم الحقيقي - تحسين المتطلبات، وتصحيح الأخطاء متعدد المنعطفات، وتبديل السياق عبر المهام - أثناء التدريب. لا يقتصر الهدف على إنشاء التعليمات البرمجية فحسب، بل العمل كشريك تعاوني موثوق به عبر سير عمل التطوير بأكمله.
3. تعدد الوسائط الأصلي منذ اليوم الأول
على عكس النماذج التي تعتمد على الرؤية كفكرة لاحقة، تم تدريب M3 باستخدام طرائق مختلطة من الخطوة صفر. أثبتت البيانات المتداخلة - حيث يتم نسج النصوص والصور معًا بشكل طبيعي ضمن تسلسلات التدريب - أنها أكثر أهمية بكثير مما كان متوقعًا. بعد إعادة بناء مسار البيانات بالكامل، يستطيع MiniMax الآن توسيع نطاق التدريب ليشمل ما يقرب من 100 تريليون رمز.
يفهم M3 النصوص والصور والفيديو أصلاً. يمكنه تشغيل كمبيوتر سطح المكتب من خلال واجهة الوكيل الخاصة به. هذا ليس نموذج رؤية منفصلاً يتم التعامل معه عبر المحول - إنه فهم موحد متعدد الوسائط مدمج في البنية.
ذكاء حقيقي، استقلالية حقيقية
قامت MiniMax بإخضاع M3 لثلاثة اختبارات قاسية في العالم الحقيقي كشفت عن أكثر بكثير مما يمكن للأرقام القياسية تحقيقه على الإطلاق.
الاختبار الأول: إعادة إنتاج ورقة بحثية. نظرًا لورقة ICLR 2025 المتميزة حول ديناميكيات الضبط الدقيق لماجستير القانون، عملت M3 بشكل مستقل لمدة 12 ساعة تقريبًا، وأنتجت 18 التزامًا و23 شخصية تجريبية، ونجحت في تكرار النتائج الأساسية للورقة - بما في ذلك تأثير الضغط في تجارب DPO وفعالية طريقة التخفيف المقترحة.
الاختبار 2: تحسين نواة CUDA. تم تسليم M3 وصفًا للمهمة، وبرنامج نصي مرجعي، وهيكل تعليمات برمجية غير وظيفي - لا يوجد تنفيذ مرجعي، ولا اختصارات. وعلى مدار 24 ساعة تقريبًا من التنفيذ المتواصل، أكملت 147 عملية تقديم معيارية و1959 استدعاءًا للأدوات. لقد أدى ذلك إلى زيادة استخدام FP8 GEMM في بنية NVIDIA Hopper من 7.6% إلى 71.3% - وهو تحسن بمقدار 9.4×. استسلمت معظم النماذج بعد 30 محاولة. أفضل حل لـ M3 جاء في المحاولة 145.
الاختبار 3: تدريب النماذج بشكل مستقل. في PostTrainBench، تم منح M3 أربعة نماذج أساسية أكملت التدريب المسبق فقط. لقد تعامل بشكل مستقل مع تركيب البيانات والتدريب والتقييم والتكرار - دون أي تدخل بشري - وسجل نتائج تنافسية مقابل Opus 4.7 وGPT-5.5.## لماذا هذا مهم بالنسبة للذكاء الاصطناعي السيادي
بالنسبة للشركات والحكومات في الشرق الأوسط، فإن جاذبية M3 تتجاوز الجدول القياسي.
تستثمر المنطقة بكثافة في البنية التحتية السيادية للذكاء الاصطناعي — مراكز البيانات المحلية، واستراتيجيات الذكاء الاصطناعي الوطنية، والأطر التنظيمية التي تتطلب بقاء البيانات الحساسة داخل الحدود الوطنية. تخلق النماذج المستندة إلى واجهة برمجة التطبيقات (API) توترًا أساسيًا: يمكن أن يكون لديك القدرة، أو يمكنك التحكم، ولكن ليس كليهما.
نماذج الوزن المفتوح مثل M3 تحل هذا التوتر. يمكنك الاستضافة الذاتية لنفس النموذج الذي يتنافس مع أنظمة الملكية الحدودية، ومعالجة بياناتك بالكامل على البنية التحتية المحلية، والحفاظ على الملكية الكاملة لمدخلاتك ومخرجاتك. لا توجد بيانات تترك نطاق اختصاصك.
تعتبر نافذة سياق المليون رمز ذات أهمية خاصة لحالات استخدام الذكاء الاصطناعي السيادي. أصبحت مراجعة المستندات القانونية، وتحليل السياسات الحكومية، وتدقيق الأكواد البرمجية على نطاق واسع، ومهام البرمجة اللغوية العصبية (NLP) العربية التي تغطي مجموعات ضخمة - كلها ممكنة على نموذج واحد يعمل على الأجهزة المحلية، دون تقطيع، ودون اقتطاع السياق، ودون تسرب البيانات إلى واجهات برمجة التطبيقات الخارجية.
التسعير والتوافر
يتوفر M3 الآن من خلال اشتراكات MiniMax API وToken Plan:
- زائد: 20 دولارًا شهريًا (حوالي 1.7 مليار رمز)
- الحد الأقصى: 50 دولارًا شهريًا (~5.1 مليار رمز)
- Ultra: 120 دولارًا شهريًا (حوالي 9.8 مليار رمز)
تشترك جميع المستويات في مجموعة رموز موحدة عبر النص والصورة والكلام والموسيقى. يمكن تبديل وضع التفكير لكل طلب - تشغيله للاستدلال المعقد والمهام الوكيلة، وإيقاف تشغيله للسيناريوهات الحساسة لزمن الاستجابة.
والأهم من ذلك، من المتوقع صدور أوزان مفتوحة وتقرير فني على Hugging Face وGitHub في غضون أيام من الإطلاق، مما سيتيح النشر المستضاف ذاتيًا بالكامل.
قامت MiniMax أيضًا بتحديث MiniMax Code، رفيقها في التشفير الوكيل، والذي يستخدم حلقة تنافس Producer + Verifier لتقسيم المهام الكبيرة إلى مسارات عمل متزامنة متعددة المراحل يمكن تشغيلها بشكل مستقل لعدة أيام.
الصورة الأكبر
يصل M3 في وقت تنقسم فيه صناعة الذكاء الاصطناعي على محورين. فمن ناحية، أصبحت النماذج الحدودية الخاصة أكثر قدرة ولكنها أيضًا أكثر تكلفة وأكثر غلقًا. ومن ناحية أخرى، ناضل النظام البيئي ذو الوزن المفتوح لسد الفجوة في الأبعاد الأكثر أهمية للنشر في العالم الحقيقي.
لا يعمل جهاز MiniMax M3 على تضييق هذه الفجوة فحسب، بل إنه يزيلها في العديد من الفئات المهمة. بالنسبة للبرمجة، والتفكير طويل السياق، والفهم متعدد الوسائط، فإن عالم الوزن المفتوح لديه الآن نموذج لا يطلب منك التنازل.
بالنسبة للمؤسسات التي تبني بنية تحتية سيادية للذكاء الاصطناعي في الشرق الأوسط وخارجه، فإن ذلك يغير الحسابات بالكامل. لم تعد قدرة Frontier AI شيئًا تستأجره. إنه شيء يمكنك امتلاكه.