أعلنت شركة سارفام Sarvam AI في الهند عن إطلاق أداتين جديدتين هما Sarvam Vision وBulbul V3 من خلال بيان رسمي صدر في الهند.
وأشارت إلى أن الأداتين مصممتان لتنفيذ مهام محددة بدقة عالية وتتعامل مع الوثائق متعددة اللغات والنصوص الهندية المعقدة.
وأوضحت أن الإعلان يأتي ضمن جهود الشركة لتوطين تقنيات الذكاء الاصطناعي في السوق المحلي.
كما أشارت إلى أن النتائج الأولية في اختبارات معيارية أظهرت أداءً واعداً في سياق المهام الخاصة.
تفوق Vision في OCR
سجل Sarvam Vision نتائج غير مسبوقة في اختبار olmOCR-Bench بواقع 84.3%، وهو ما فاق أداء نماذج عالمية مثل ChatGPT وGemini 3 Pro في هذا الاختبار.
وحصل على 93.28% في اختبار OmniDocBench v1.5، مع قدرته على التعامل مع التخطيطات المعقدة والجداول والمعادلات.
ويرى المراقبون أن هذا الأداء يعكس تركيزاً خاصاً على أنظمة OCR المرتبطة باللغة الهندية والوثائق الهندية المعقدة.
السر الحقيقي وراء هذا المستوى من الأداء يكمن في تدريبي Sarvam Vision على أنماط كتابة وخطوط هندية محلية ولغات إقليمية متعددة، ما يمنحه ميزة في قراءة النصوص الهندية بدقة أعلى من نماذج عامة لم تُصمَّم خصيصاً لهذا السياق.
ويُنظر إلى ذلك كأنموذج عملي يوضح إمكانية التفوق في مهام محدودة إذا كان النطاق واضحاً ومحدداً.
كما يشير المحللون إلى أن هذا التفوق يجعل Vision خياراً عملياً للمؤسسات الهندية التي تتعامل مع المستندات الرسمية الممسوحة ضوئيًا ووثائق حكومية متعددة اللغات.
Bulbul V3 وتحويل النص إلى صوت
Bulbul V3 هي أداة تحويل النص إلى صوت (Text-to-Speech) تركز على اللهجات الهندية ونطق اللغات المحلية.
ووفقاً للاختبارات المعتمدة، تفوقت Bulbul V3 على ElevenLabs في سياق الهند، وهو ما يعكس توافقها مع الاستخدام المحلي.
ويرجع ذلك إلى تدريبها على الإيقاع الطبيعي للكلام واللهجات الهندية، مما يجعل الناتج الصوتي أكثر طبيعياً وواقعية للمستخدم الهندي.
حدود SARVAM AI كبديل شامل
رغم التفوق الملحوظ في مهام محددة، لا تُعد Sarvam AI نموذجاً عاماً للذكاء الاصطناعي مثل ChatGPT أو Gemini.
فنماذجها مصممة لأداء وظائف دقيقة للغاية ولا تدعم المحادثات الطويلة أو إنتاج محتوى إبداعي متنوع، كما أنها لا تغطي مسائل متعددة المجالات.
على سبيل المثال، يستطيع Gemini إعداد اختبارات تجريبية وتوفير مسارات توجيهية، بينما يمكن لـ ChatGPT تحليل صور الأشعة الطبية وتقديم تصور مبدئي لما يظهر فيها، وهي استخدامات غير متاحة حالياً لدى Sarvam AI.
الفرق في الحجم والموارد
يبرز فرق الحجم بين Sarvam AI ونماذج مثل ChatGPT أو Gemini من حيث عدد المعاملات.
يضم Sarvam Vision نحو 3 مليارات باراميتر، بينما يُشاع أن Gemini 3 يحتوي على نحو 2 تريليون باراميتر.
وبناء على ذلك، تتطلب النماذج الكبيرة موارد حوسبة وبنى تحتية ضخمة، وهو ما يجعل توفيرها محلياً في الهند في الوقت الراهن أمراً غير متاح بشكل واسع.
إنجاز هندي .. سارفام
يعتبر ما حققته Sarvam AI إنجازاً مهماً يثبت إمكانية تطوير أدوات عالمية المستوى داخل الهند، ولا تدَّعي الشركة أنها بديل عام للذكاء الاصطناعي، لكنها تُظهر أن التفوق في مهام محددة ممكن عندما يكون التركيز ذكياً ومحدوداً.
وتؤكد النتائج أن التحدي الحقيقي أمام الهند ليس الكفاءة البشرية فحسب، بل في البنية التحتية والقدرات الحاسوبية اللازمة لدعم مثل هذا التطوير.
كما تُعد أمثلة Vision وBulbul بمثابة إثبات مفهوم يفتح باباً أمام تطوير حلول محلية قادرة على منافسة النماذج العالمية في سياقات خاصة.
منوعات
سارفام Sarvam.. نموذج محلي هندي يقلق ChatGPT وGemini
114

مقالات ذات صلة

هل يوجد رابط بين فصيلة الدم وخطر الإصابة بالسكري؟
توصلت دراسة حديثة إلى وجود رابط بين فصيلة دم الشخص وإمكانية تحديد مستوى خطر الإصابة ببعض الأمراض خاصة مرض السكري
5

سرعة تحميل الألعاب الإلكترونية عبر منصة STEAM السعودية تصل إلى 100%
أصدرت هيئة الاتصالات والفضاء والتقنية السعودية تقرير الربع الرابع من عام 2025 لمبادرة "GameMode"، الذي يقارن جودة أداء مقدمي خدمات الاتصالات في المملكة لأشهر الألعاب الإلكترونية
8

عالمياً.. تذاكر الطيران ترتفع أكثر من 500 بالمئة في شهر واحد
شهدت أسعار تذاكر الطيران عالمياً ارتفاعاً غير مسبوق منذ اندلاع الحرب الأميركية
- الإسرائيلية على إيران، في ظل اضطرابات واسعة
52

غوغل تقلل زمن الاستجابة بشكل غير مسبوق مع إطلاقها لميزة البحث الحي
أطلقت غوغل ميزة البحث الحي التي تمثل نقلة نوعية في تفاعل المستخدمين مع محرك
البحث، حيث تدمج بين الرؤية الحاسوبية ومعالجة الصوت الفورية
133

ميتا تطلق تحديث جديد لتطبيق "واتساب" لتوسيع استخدام الذكاء الاصطناعي
أعلنت شركة ميتا إطلاق تحديث جديد لتطبيق واتساب يهدف إلى تحسين تجربة المستخدم
اليومية
180
