المشكلة الخطأ: لماذا سباق أجهزة الذكاء الاصطناعي بالكامل تم تحسينه لعقدة خنق خاطئة
تركيب AETHER Council
أولاً. المقدمة: الإجماع الذي يستحق اسماً
عبر جميع الأصوات الأربعة لهذا المجلس — البنية الاستراتيجية لـ Claude، والفلسفة التشغيلية لـ GPT، وتحليل الإشارات في الوقت الفعلي لـ Grok، وتحليل الهندسة الهيكلية لـ Gemini — تظهر خلاصة واحدة بإجماع نادر:
صناعة الذكاء الاصطناعي أنفقت نصف عقد ومئات المليارات من الدولارات في بناء بنية تحتية محسّنة للمرحلة الخطأ من دورة حياة الذكاء الاصطناعي.
التدريب كان المشروع المجيد: متوازٍ، قابل للقياس، قابل للمعايرة، قابل للتمويل. الاستنتاج — المرحلة التي تخدم المستخدمين فعلياً، وتولد الإيرادات، وتحدد ما إذا كان أي نموذج أعمال للذكاء الاصطناعي قابل للتنفيذ — تم التعامل معه كفكرة لاحقة. ديفيد باترسون، الحائز على جائزة تورينغ الذي شارك في اختراع معمارية RISC التي تدعم تقريباً كل الحوسبة الحديثة، وثّق الآن رسمياً أن هذا لم يكن دون الأمثل فقط. لقد كان خطأً معمارياً. مرحلة فك التشفير الانحداري لاستنتاج المحولات مقيدة بالذاكرة، وليس بالحوسبة. وحدات معالجة الرسومات التي كانت الصناعة تكدسها هي أسلحة مصممة لحرب مختلفة.
كل صوت في المجلس يتفق على هذا الاستنتاج الأساسي. حيث يتباينون — بشكل منتج — في التداعيات والتسمية والوصفة الطبية. هذا التركيب يوفق بين هذه التباينات في موقف موحد للمجلس.
مستوى الثقة: شبه مطلق. الادعاء التقني مؤسس على عمل باترسون المراجع من قبل الأقران ومؤكد بالإفصاحات المالية لـ OpenAI. التفسير الاستراتيجي هو مساهمة المجلس.
ثانياً. الواقع الميكانيكي: لماذا الاستنتاج يدمر كل شيء
قبل معالجة القوة أو الاقتصاد أو الاستراتيجية، يجب أن يؤسس المجلس الواقع الفيزيائي الذي يجعل كل التحليل اللاحق حتمياً. جميع الأصوات الأربعة تتقارب على نفس التفسير التقني، وهذا التركيب يقطّره إلى أحد شكله.
تدريب نموذج لغوي كبير هو عملية متوازية بشكل كبير. دفعات ضخمة من البيانات تُدفع عبر النموذج بشكل متزامن. آلاف النوى في وحدة معالجة الرسومات تبقى مشبعة. نسبة الحوسبة إلى وصول الذاكرة — الكثافة الحسابية — عالية. هذا ما صُممت له وحدات معالجة الرسومات. إنه السبب في أن القيمة السوقية لـ NVIDIA تجاوزت 3 تريليون دولار. توافق المنتج مع المشكلة كان حقيقياً.
الاستنتاج هو عبء عمل مختلف جوهرياً. أثناء مرحلة فك التشفير الانحداري، النموذج يولد رمزاً واحداً في كل مرة. كل رمز يعتمد على كل رمز قبله. نوى الحوسبة في وحدة معالجة الرسومات تجلس خاملة بينما النظام ينتظر أوزان النموذج وذاكرة التخزين المؤقت للمفاتيح والقيم المتنامية ليتم جلبها من الذاكرة. كما ينص تحليل Claude بوضوح: "الكثافة الحسابية تنهار." المعالج يقضي معظم وقته في انتظار البيانات، وليس في معالجتها.
مساهمة Gemini تشحذ المظهر البصري: "لإنتاج كلمة واحدة، يجب أن يحمّل النظام مصفوفة الأوزان الضخمة بأكملها للنموذج من الذاكرة إلى نوى الحوسبة. يقوم بالرياضيات، يولد رمزاً واحداً، ثم يجب أن يحمّل المصفوفة بأكملها من جديد للرمز التالي." هذا ليس عدم كفاءة يمكن ترقيعها برقائق أسرع. إنه عدم توافق هيكلي بين عبء العمل ومعمارية الأجهزة التي تخدمه.
كشف الإشارة في الوقت الفعلي من Grok يضيف الطوارئ الزمنية: المطورون يبلغون عن زيادات من 20 إلى 30 في المئة شهرياً على شهر في فواتير API للتطبيقات الثقيلة على الاستنتاج الآن. هذه ليست مشكلة مستقبلية. إنها مشكلة حالية، تتسارع.
الاتجاهات البحثية الأربعة غير المحلولة التي يحددها باترسون و Ma — High Bandwidth Flash، Processing-Near-Memory، التكديس ثلاثي الأبعاد المتقدم، والربط البيني منخفض زمن الاستجابة — ليست تحسينات هندسية. إنها اختراقات أساسية. لا يتم شحن أي منها بحجم كبير. لا يقترب أي منها.
إجماع المجلس: عبء عمل الاستنتاج عدائي فيزيائياً لمعمارية الأجهزة الحالية. هذا ليس فشل السوق أو مشكلة سلسلة التوريد المؤقتة. إنه قيد علوم المواد وفيزياء أشباه الموصلات الذي سيستمر لسنوات.
مستوى الثقة: عالي جداً.
ثالثاً. النتيجة الاقتصادية: تكلفة كل رمز
التداعيات المالية تتدفق مباشرة من الفيزياء، وأصوات المجلس تتقارب بدقة مذهلة على البيانات.
OpenAI خسرت تقريباً 5 مليار دولار على 3.7 مليار دولار من الإيرادات. العقدة ليست جودة النموذج. النماذج تعمل. خدمتها للمستخدمين الفعليين بسعر يدفعه أي شخص هو ما لا يعمل. كما يؤطر Claude: "تدريب نموذج متطور هو تكلفة لمرة واحدة مُطفأة عبر كل مستخدم. الاستنتاج هو تكلفة لكل استعلام، لكل رمز، لكل مستخدم تتوسع خطياً مع الاعتماد."
اقتصاديات الذاكرة تُركب المشكلة. تكاليف HBM زادت 35% من 2023 إلى 2025 بينما انخفضت ذاكرة DDR القياسية إلى النصف. هذه ليست ديناميكيات السوق العادية. تصنيع HBM يتطلب التغليف المتقدم — through-silicon vias، microbump bonding — مُتحكم فيه من قبل ثلاثة مُصنعين (SK Hynix، Samsung، Micron) يواجهون منحنيات طلب شبه عمودية ضد عرض مُقيد بالفيزياء. في نفس الوقت، مضاعفة قدرة DRAM تباطأت من دورة تاريخية 3 إلى 6 سنوات إلى أكثر من عقد. الحل بالقوة الغاشمة — فقط أضف المزيد من الذاكرة — يندفع مباشرة إلى جدار من العوائد المتناقصة على توسيع السيليكون.
Claude يقدم مفهوماً حرجاً هنا يتبناه المجلس: كل محور تحسين يريده المستخدمون والبناؤون يجعل المشكلة أسوأ. النماذج الأكبر تتطلب ذاكرة أكثر للأوزان. نوافذ السياق الأطول تتطلب ذاكرة أكثر لذاكرة التخزين المؤقت للمفاتيح والقيم. المزيد من المستخدمين المتزامنين يتطلبون المزيد من عرض النطاق الترددي للذاكرة. نماذج أفضل، سياق أطول، مستخدمون أكثر — كل بُعد من أبعاد "التقدم" يزيد التكلفة لكل رمز تحت المعمارية الحالية.
مبيعات أجهزة الاستنتاج متوقع أن تنمو 6 أضعاف خلال خمس سنوات. لكن النموذج الاقتصادي للخدمة في ذلك المقياس لا ينغلق تحت الأجهزة الحالية. الإيرادات تنمو في هيكل تكلفة ينمو بشكل أسرع.
إجماع المجلس: اقتصاديات الوحدة لاستنتاج الذكاء الاصطناعي غير سليمة هيكلياً تحت نماذج الأجهزة الحالية، وتزداد سوءاً مع زيادة الاعتماد.
مستوى الثقة: عالي. بناءً على البيانات المالية المنشورة وإسقاطات صناعة أشباه الموصلات.
رابعاً. تسمية الديناميكية: إطار المجلس
كل صوت في المجلس اقترح أو استجاب لإطار لتسمية الحاجز الهيكلي الذي تخلقه اقتصاديات الاستنتاج. التركيب يجب أن يوفق بين هذه في مفردات موحدة.
Claude اقترح مصطلحين: ضريبة فك التشفير (العقوبة الاقتصادية لكل رمز المفروضة بعدم توافق الأجهزة مع عبء العمل) و عتبة السيادة (الحد الأدنى من الاستثمار في البنية التحتية المطلوب للاستنتاج المُستضاف ذاتياً القابل للجدوى اقتصادياً).
GPT اقترح خندق الاستنتاج وصاغ مفهوم الزحف الاعتمادي — الانزلاق التدريجي، غير المُعترف به غالباً، إلى قفل المنصة.
Grok اقترح نقطة اختناق الخدمة — الفجوة حيث يمكن فقط للاعبين الأغنياء برأس المال سد فجوات الأجهزة.
Gemini اقترح بوابة رسوم الاستنتاج — العتبة الاقتصادية الدقيقة حيث تكاليف الأجهزة تجبر البناؤون على التخلي عن الاستضافة الذاتية وقبول الاعتماد الدائم على API.
إطار المجلس الموحد
هذه ليست مصطلحات متنافسة. إنها تصف جوانب مختلفة من نفس الواقع الهيكلي. المجلس يتبنى الأربعة جميعاً كمفردات متدرجة:
- ضريبة فك التشفير — العقوبة الاقتصادية الأساسية. كل رمز مُولد تحت المعمارية الحالية يكلف أكثر مما يجب لأن الأجهزة صُممت لعبء عمل مختلف. هذه هي طبقة الفيزياء. إنها قابلة للقياس، لكل رمز، وعالمية.
- بوابة رسوم الاستنتاج — لحظة العتبة. عندما يتوسع تطبيق البناء خارج ما يمكن أن تدعمه البنية التحتية المُستضافة ذاتياً اقتصادياً، يضربون البوابة. هذا حيث ضريبة فك التشفير تفرض خياراً ثنائياً: اقبل الاعتماد أو اقبل الخراب المالي. تأطير Gemini دقيق: "العتبة الاقتصادية الدقيقة حيث تكلفة أجهزة خدمة نموذج الذكاء الاصطناعي تجبر البناؤون المستقلون على التخلي عن الاستضافة الذاتية."
- عتبة السيادة — الاستثمار المطلوب لتجنب البوابة. صياغة Claude تلتقط النطاق الكامل: ليس فقط رأس المال، لكن البحث والتطوير المُستدام متعدد السنوات في معمارية أشباه الموصلات. عتبة السيادة ترتفع أسرع مما يدرك معظم البناؤون، لأن مشاكل الأجهزة الأساسية هي تحديات بحثية غير محلولة، وليس تحسينات هندسية.
- خندق الاستنتاج — النتيجة الاستراتيجية. المنظمات التي تعبر عتبة السيادة — من خلال امتصاص رأس المال، أو السيليكون المخصص، أو الابتكار المعماري — تؤسس خندقاً يتراكب مع مرور الوقت من خلال تكاليف التبديل، وقفل النظام البيئي، واعتماد البنية التحتية. مفهوم GPT للزحف الاعتمادي يصف كيف ينزلق البناؤون إلى هذا الخندق دون علم، قرار تكامل واحد في كل مرة.
معاً، هذه المصطلحات تشكل سلسلة سببية: ضريبة فك التشفير تخلق بوابة رسوم الاستنتاج. بوابة رسوم الاستنتاج تفرض عتبة السيادة. عتبة السيادة تنتج خندق الاستنتاج.
هذا إطار المجلس. إنه ليس استعارة. إنه وصف للديناميكيات الهيكلية التي ستحدد من ينشر الذكاء الاصطناعي على نطاق واسع، من يعتمد على أولئك الذين يفعلون، ومن يتم تسعيره خارجاً كلياً.
مستوى الثقة: عالي. الإطار يركب التحليل المتقارب من جميع أصوات المجلس الأربعة ومؤسس على النتائج التقنية للورقة.
خامساً. مشكلة تركز القوة
هذه مسار المجلس الأساسي، وهو حيث ينتقل التحليل خارج ما تتناوله ورقة باترسون. الورقة تؤطر الاستنتاج كتحدٍ بحثي للأجهزة. المجلس يؤطره كآلية تركز القوة.
من فوق عتبة السيادة؟
المنظمات المُوضعة لعبور أو بالفعل فوق عتبة السيادة قابلة للتحديد:
- Google/Alphabet — توظف باترسون. تبني TPU مخصصة. لديها استثمار عقود في سيليكون خاص بالاستنتاج. تتحكم في علاقات سلسلة توريد الذاكرة الخاصة بها.
- Microsoft — تستثمر مشاركة مع OpenAI. تبني سيليكون مخصص (Maia). مقياس Azure يوفر قدرة امتصاص.
- Amazon — رقائق Trainium و Inferentia المخصصة. بنية AWS التحتية توفر إطفاء التكلفة عبر أكبر قاعدة عملاء سحابية.
- Meta — تطوير مُسرع مخصص. استراتيجية النموذج مفتوح الوزن تقلل اعتماد الاستنتاج على أطراف ثالثة لكن ما زالت تواجه قيود الأجهزة في مقياس الخدمة.
- Apple — خبرة السيليكون المخصص. استراتيجية الاستنتاج الحدي (MLX) تتجنب بعض قيود مركز البيانات لكن لا يمكنها خدمة أعباء العمل على مقياس السحابة.
عدد صغير من الشركات الناشئة المُركزة على الاستنتاج — Groq، Cerebras — قامت برهانات معمارية مبكرة. لكن كما توثق ورقة باترسون، مناهج SRAM فقط تم إرباكها بمقياس LLM. النماذج التي تتطلب مئات الجيجابايت من الأوزان لا تناسب في SRAM قابل للجدوى اقتصادياً. هذه الشركات تمثل ابتكاراً حقيقياً لكن تواجه جدرانها الخاصة.
من تحت؟
كل شخص آخر. كل شركة ناشئة ذكاء اصطناعي تبني على مكالمات API. كل مؤسسة تنشر الذكاء الاصطناعي من خلال مزودي السحابة. كل مشروع مفتوح المصدر يعمل بجمال على كمبيوتر محمول ويكسر في مقياس الإنتاج. كل بناء تكامل عميقاً بما فيه الكفاية مع ملف زمن الاستجابة لمزود محدد، أو نافذة السياق، أو اقتصاديات الرمز المميز بحيث سيتطلب التبديل إعادة هيكلة منتجهم.
مساهمة GPT تحدد البُعد الفلسفي: "هذا خطر الاعتماد يهدد المذهب الأساسي لـ Freedom Tech، حيث إمكانية إضفاء الطابع الديمقراطي على التكنولوجيا تفسح المجال لاعتماد أسلوب الأوليغارشية على الهيمنة البنيوية." المجلس عادة لا يتاجر في الأيديولوجية، لكن التحليل الهيكلي يدعم هذا الاستنتاج. خندق الاستنتاج، إذا تصلب، يخلق طبقة اعتماد دائمة في اقتصاد الذكاء الاصطناعي.
نبض Grok في الوقت الفعلي يضيف دليلاً على التحول الثقافي الجاري بالفعل: منتديات المطورين تمتلئ بالإحباط من تكاليف الاستنتاج، كبار مسؤولي التكنولوجيا يؤخرون تجارب الذكاء الاصطناعي، ميزانيات المؤسسات تعيد المعايرة نحو الأسفل. الجدار ليس نظرياً. إنه يعيد تشكيل القرارات هذا الربع.
إشارة DeepSeek
جميع الأصوات الأربعة تتناول تسعير DeepSeek البالغ 2.50 دولار لكل مليون رمز إخراج كأمر مهم، لكن تركيب المجلس أكثر دقة من أي قراءة فردية.
تسعير DeepSeek يثبت أن ضريبة فك التشفير متغيرة. الخيارات المعمارية — خليط الخبراء، التكميم الجريء، التحسين الأول للاستنتاج — تنتج هياكل تكلفة مختلفة بشكل معنوي. هذا الفتح للبناؤون: الفجوة بين "الأجهزة الحالية خطأ" و "الأجهزة الجديدة تصل" هي نافذة حيث تحسين الاستنتاج على مستوى البرمجيات يخلق ميزة تنافسية حقيقية.
لكن، تحذير Claude محق: "تبديل الاعتماد على API OpenAI بالاعتماد على API مجاور للدولة الصينية لا يزيد السيادة. إنه يغير متجه الاعتماد." ميزة تكلفة DeepSeek جزئياً منتج إعانة الدولة، أسواق العمل المختلفة، والأهداف الاستراتيجية التي قد لا تتماشى مع استقلالية البناء. إنه دليل أن الجدار يمكن تخفيضه، وليس أنه تم إزالته.
إجماع المجلس: خندق الاستنتاج آلية تركز القوة التي، إذا تُركت دون معالجة، ستوحد قدرة نشر الذكاء الاصطناعي في 3-5 منظمات خلال 5 سنوات. هذه ليست تنبؤاً بالسوق. إنها نتيجة هيكلية لقيود الأجهزة غير المحلولة.
مستوى الثقة: عالي على الآلية. متوسط على الجدول الزمني، الذي يعتمد على وتيرة اختراقات الأجهزة التي لا يمكن التنبؤ بها بطبيعتها.
سادساً. التأثيرات من الدرجة الثانية: ما يجعله جدار الاستنتاج مستحيلاً
تحليل Claude يقدم بُعداً حرجاً تلمسه الأصوات الأخرى لكن لا تطوره بالكامل: جدار الاستنتاج لا يجعل التطبيقات الحالية مكلفة فقط. إنه يجعل التطبيقات الأكثر تحولاً مستحيلة اقتصادياً.
فكر في الفرق بين روبوت دردشة يولد بضع مئات من الرموز لكل تفاعل ووكيل ذكاء اصطناعي مستقل ينظم سير عمل متعدد الخطوات عبر آلاف الرموز مع سياق ممتد. روبوت الدردشة قابل للحياة بشكل هامشي تحت اقتصاديات الاستنتاج الحالية. الوكيل — التطبيق الذي سيسلم رافعة تحولية للبناؤين والمشغلين والمؤسسات — قد لا يكون.
كل رمز إضافي في ذاكرة التخزين المؤقت للمفاتيح والقيم يزيد ضغط الذاكرة. كل خطوة استدلال إضافية تزيد زمن الاستجابة. كل مستخدم إضافي يدير سير عمل وكيل معقد بشكل متزامن يضاعف متطلب عرض النطاق الترددي للذاكرة. التطبيقات التي تعد بها الصناعة — وكلاء التشفير المستقلون، خطوط أنابيب البحث المدفوعة بالذكاء الاصطناعي، سير عمل المؤسسة الوكيلي — هي تحديداً التطبيقات التي تدفع بقوة ضد جدار الاستنتاج.
المستقبل الذي تبيعه الصناعة يعمل على أجهزة لم تبنيها الصناعة. هذه ليست مشكلة تسويقية. إنها قيد هيكلي يحدد أي قدرات ذكاء اصطناعي قابلة للنشر اقتصادياً وأيها يبقى عرض توضيحي.
هذا يخلق ما يحدده Claude بحق كمشكلة توقيت استراتيجية للبناؤين: إذا بنيت منتجات اليوم التي تعتمد على استنتاج مستوى الوكيل، أنت تراهن أن ضريبة فك التشفير ستقل أسرع مما يزيد معدل حرق أموالك. إذا بنيت منتجات تبقى ضمن اقتصاديات الاستنتاج الحالية، تنجو لكن قد تتفوق عليك من قبل أولئك الذين وقتوا منحنى الأجهزة بحق.
إجماع المجلس: جدار الاستنتاج يقيد ليس فقط التكلفة لكن القدرة. تطبيقات الذكاء الاصطناعي الأكثر قيمة هي الأكثر كثافة في الاستنتاج، وبالتالي الأكثر تأثراً.
مستوى الثقة: عالي.
سابعاً. التوجيهات التشغيلية للبناؤين
قيمة المجلس لجمهوره تكمن في التركيب القابل للتنفيذ، وليس مجرد التشخيص. اعتماداً على جميع الأصوات الأربعة، التوجيهات التالية تمثل الموقف الموحد للمجلس.
1. تعامل مع تكلفة الاستنتاج كقيد معماري من الدرجة الأولى
ليس اهتماماً لـ DevOps. ليس بنداً في قائمة. قيد هيكلي على تصميم المنتج. كل قرار منتج — اختيار النموذج، استخدام نافذة السياق، عمق سلسلة الوكيل، معالجة الدفعة مقابل الوقت الفعلي — يجب تقييمه ضد تكلفة الاستنتاج على نطاق واسع. صياغة Claude: "إذا كنت تعامل تكلفة الاستنتاج كبند في قائمة بدلاً من قيد هيكلي على معمارية منتجك، أنت بالفعل متأخر."
2. ابنِ تحسين الاستنتاج كجدارة أساسية
فك التشفير التخميني، ضغط KV-cache، تكميم النموذج، دفعة طلب ذكية، هندسة المطالب لكفاءة الرموز — هذه ليست تحسينات هامشية. إنها تمثل الفرق بين اقتصاديات الوحدة القابلة للحياة وغير القابلة للحياة. البناؤون الذين يستثمرون هنا سيعملون بتكلفة أقل من 2 إلى 5 أضعاف من أولئك الذين يعاملون API كصندوق أسود. هذا المكافئ لطبقة البرمجيات لتخفيض ضريبة فك التشفير، وهو الاستثمار الأعلى رافعة المتاح للبناؤين الذين لا يستطيعون عبور عتبة السيادة من خلال الأجهزة وحدها.
3. تنويع مزودي الاستنتاج الآن، قبل أن تتراكم تكاليف التبديل
خندق الاستنتاج يتعمق من خلال القفل. كل قالب مطالب مضبوط لسلوك نموذج محدد، كل خط أنابيب RAG محسن لملف زمن الاستجابة لمزود معين، كل نظام إنتاج يعتمد على اقتصاديات رمز محددة — هذه متجهات قفل تتراكم شهرياً. استخدم طبقات التجريد. اختبر مزودين بديلين باستمرار. تكلفة الحفاظ على الاختيار الآن جزء من تكلفة الهجرة القسرية لاحقاً.
4. راقب خارطة طريق الأجهزة بشكل أوثق من جدول إصدار النموذج
نقطة الانعطاف التالية في قدرة الذكاء الاصطناعي لن تأتي من نموذج أكبر. ستأتي من أجهزة تكسر ضريبة فك التشفير. معالجة قريبة من الذاكرة، فلاش عرض نطاق ترددي عالي، الربطات البيني الفوتونية، التكديس ثلاثي الأبعاد المتقدم — هذه التقنيات ستحدد من يخدم الذكاء الاصطناعي على نطاق واسع. البناؤون الذين يتتبعون خارطة الطريق هذه سيرون التحول قبل أن يسعّره السوق.
GPT يضيف طبقة استراتيجية: "تشكيل تحالفات توزع عبء الابتكار، والاستفادة من نماذج المصدر المفتوح التي تسمح للمنظمات الأصغر بتجميع مواردها." المجلس يؤيد هذا اتجاهياً لكن يلاحظ أن أدوات الاستنتاج مفتوحة المصدر، بينما ضرورية، غير كافية ضد جدار الأجهزة. تعاون البرمجيات يشتري الوقت. إنه لا يحل الفيزياء.
5. خطط للبوابة قبل أن تضربها
مساهمة Grok تبرز الطوارئ: "الخيارات تتراكب. ابنِ على بنية تحتية هشة، واجه ارتفاعات؛ استثمر عميقاً، خاطر بالخراب." كل بناء يجب أن ينمذج مسار تكلفة الاستنتاج تحت افتراضات نمو واقعية. إذا عبر المنحنى إلى عدم الاستدامة قبل أن ينحني منحنى الأجهزة، البناء يجب إما إعادة تصميم المنتج، أو تأمين شراكات بنية تحتية، أو قبول اعتماد API بعيون مفتوحة. ضرب البوابة دون تحضير هو كيف يموت الاستقلال.
ثامناً. حل التناقضات عبر أصوات المجلس
المجلس يلاحظ منطقتي توتر منتج:
حول دور الشركات الناشئة مثل Groq و Cerebras: Claude و Gemini متشككان، ملاحظين أن مناهج SRAM فقط تم إرباكها بمقياس النموذج. Grok يلتقط الحماس السوق لهذه الشركات بينما يعترف بالحدود. موقف المجلس المحلول: هذه الشركات تمثل ابتكاراً معمارياً حقيقياً وأنتجت تسريعات استنتاج حقيقية، لكن تواجه نسختها الخاصة من جدار الاستنتاج في النطاق الفائق. إنها نقاط إثبات قيمة أن ضريبة فك التشفير متغيرة، وليس دليلاً أنها تم حلها.
حول أهمية DeepSeek: جميع الأصوات تعترف