تواجه نماذج الذكاء الاصطناعي قيداً حرجاً يعرف باسم "عنق الزجاجة للسياق الطويل"، مما يحد من قدرتها على معالجة المستندات أو المحادثات المطولة.
وفي إطار السعي العالمي للتغلب على هذه العقبة، طرحت شركة "ديب سيك" الصينية الناشئة تقنية "DeepSeek-OCR" في أكتوبر الماضي، مدعيةً أنها ثورية وقادرة على ضغط النصوص الطويلة باستخدام تمثيلات بصرية، مما يقلل حجم البيانات اللازمة للمعالجة.
إلا أن دراسة حديثة أجراها باحثون من جامعة توهوكو اليابانية والأكاديمية الصينية للعلوم، تشكك في فعالية هذه المنهجية.
ووفقاً للبحث، فإن التقنية تعتمد بشكل كبير على المعرفة اللغوية المسبقة المخزنة في النموذج، وليس على الفهم البصري الحقيقي كما أعلنت الشركة، مما يجعل مقاييس الأداء المعلنة "مضللة".
وأظهرت تجارب الفريق انخفاض دقة إجابات النموذج على الأسئلة المرئية إلى حوالي 20% عند محاولة التأثير على استنتاجه بنصوص إضافية، مقارنة بدقة تزيد عن 90% للنماذج القياسية.
وخلص الباحثون إلى أن هذه النتائج تثير تساؤلات حول جدوى طرق الضغط البصري الحالية كحل فعلي لمشكلة السياق الطويل، مشيرين إلى الحاجة لاستراتيجيات بديلة.
من جهة أخرى، يرى بعض الخبراء مثل الدكتور لي بوجي، خريج جامعة العلوم والتكنولوجيا الصينية ومؤسس شركة ناشئة في بكين، أن هذه السمة "سلاح ذو حدين".
فبينما قد يساعد الاعتماد على المعرفة المسبقة في فهم النصوص المكتوبة بخط اليد، إلا أنه قد يصبح عائقاً عند التعامل مع النصوص المطبوعة بوضوح، مؤكداً أنه لا يوجد حل سحري واحد يناسب جميع الحالات.
المحرر: عمار الكاتب