كتبت سماح لبيب
الخميس، 23 أكتوبر 2025 06:00 صأطلقت شركة DeepSeek، نموذجًا جديدًا مفتوح المصدر للذكاء الاصطناعي يُعيد تعريف كيفية تحليل ومعالجة النصوص العادية ، ويحمل النموذج اسم DeepSeek-OCR، وهو مصمم لتحويل النص إلى بُعد بصري باستخدام رسم الخرائط ثنائية الأبعاد، مما يسمح بضغط السياق الطويل في شكل يسهل على الآلة استيعابه.
توضح الشركة، أن نماذج اللغة الكبيرة (LLMs) تكون أكثر كفاءة في معالجة البكسلات مقارنة بالنصوص التقليدية، إذ يسمح هذا الأسلوب للنموذج بالتقاط المعلومات الأكثر صلة لتوليد استجابات أدق وأسرع ، ووفقًا لبيانات DeepSeek، فإن النهج الجديد يُحقق دقة أعلى مقارنة بالطرق التقليدية فى فهم وتحليل النصوص.
تقنية جديدة مبنية على OCRيعتمد DeepSeek-OCR على تقنية التعرّف الضوئي على الحروف (OCR)، لكنه يذهب خطوة أبعد من ذلك، فهو يحوّل النصوص إلى صور قبل تحليلها، مما يمكّنه من تخزين وفهم كميات كبيرة من المعلومات بطريقة أكثر كفاءة.
ويُعرف هذا المفهوم باسم "الضغط البصري للسياق"، حيث يُحوّل النموذج صفحات نصية طويلة إلى صور، ثم يُترجمها إلى رموز بصرية مكثّفة أصغر حجمًا بكثير من الرموز النصية المعتادة.
على سبيل المثال، يمكن للنموذج معالجة مقال من 1000 كلمة باستخدام نحو 100 رمز بصرى فقط وهو إنجاز كبير فى تقليص حجم البيانات دون فقدان المعنى.
النموذج متاح حاليًا عبر GitHub تحت رخصة معهد ماساتشوستس للتكنولوجيا (MIT)، ما يتيح استخدامه للأغراض الأكاديمية والتجارية، وقد حظي DeepSeek-OCR بإقبال واسع، إذ تجاوز 6700 إعجاب خلال 24 ساعة فقط من إطلاقه، ما يعكس الاهتمام الكبير بالنهج الجديد في معالجة النصوص بصريًا.
ملحوظة: مضمون هذا الخبر تم كتابته بواسطة اليوم السابع ولا يعبر عن وجهة نظر مصر اليوم وانما تم نقله بمحتواه كما هو من اليوم السابع ونحن غير مسئولين عن محتوى الخبر والعهدة علي المصدر السابق ذكرة.