كشفت فاست داتا، شركة منصات البيانات لعصر الذكاء الاصطناعي، اليوم عن الرؤية الكاملة للشركة من خلال تقديم منصة تحويلية لحوسبة البيانات مصممة لتكون أساس الاكتشاف بمساعدة الذكاء الاصطناعي.
منصة فاست داتا للبيانات هي خدمة البنية التحتية العالمية التي تقدّمه الشركة، موفّرةً خدمات التخزين وقاعدة البيانات وخدمات محرك الحوسبة الافتراضية في نظام قابل للتطوير تم بناؤه من الألف إلى الياء لمستقبل الذكاء الاصطناعي.
اذهب إلى ما وراء نماذج اللغة الكبيرة إلى الاكتشاف بمساعدة الذكاء الاصطناعي
في حين أن الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة (LLMs) قدمت للعالم القدرات المُبكرة للذكاء الاصطناعي، فإن النماذج اللغوية الكبيرة تقتصر على أداء المهام الروتينية مثل الإبلاغ عن الأعمال أو تلاوة المعلومات المعروفة مسبقاً. سيتحقق الوعد الحقيقي للذكاء الاصطناعي عندما تتمكن الآلات من إعادة إنشاء عملية الاكتشاف من خلال التقاط البيانات وتوليفها والتعلم منها. وذلك لتحقيق مستوى من التخصص كان يستغرق عقودًا في غضون أيام.
سيؤدي عصر الاكتشاف المدفوع بالذكاء الاصطناعي إلى تسريع سعي البشرية لحل أكبر تحدياتها حيث يمكن أن يساعد الذكاء الاصطناعي الصناعات في العثور على علاجات للأمراض والسرطانات، وصياغة مسارات جديدة لمعالجة تغير المناخ، واتباع مناهج ثورية رائدة في الزراعة، والكشف عن مجالات جديدة من العلوم والرياضيات لم يفكر فيها العالم بعد.
على هذا النحو، تحول الشركات تركيزها بشكل متزايد إلى تطبيقات الذكاء الاصطناعي، وبينما يمكن للمؤسسات تجميع التقنيات معاً من العروض السحابية العامة أو الخاصة المتباينة، يحتاج العملاء إلى منصة بيانات تبسط تجربة إدارة البيانات ومعالجتها في كومة واحدة موحدة. أصبحت منصات البيانات الحالية اليوم معروفة لدى الشركات العالمية، مما قلل بشكل كبير من تعقيد نشر البنية التحتية لذكاء الأعمال وتطبيقات الإبلاغ، ولكنها لم يتم بناؤها لتلبية احتياجات تطبيقات التعلم العميق الجديدة. يجب أن يوفر الجيل القادم من البنية التحتية للذكاء الاصطناعي إمكانية الوصول إلى الملفات الموازية، والأداء المُحسن بوحدة معالجة الرسومات للتدريب على الشبكة العصبية والاستدلال على البيانات غير المنظمة، ومساحة اسم عالمية تمتد عبر بيئات هجينة متعددة السحب والحواف، وكلها موحدة في عرض واحد يسهل إدارته من أجل تمكين التعلم العميق الموحد.
منصة فاست داتا
لا يمكن بناء أساس العصر القادم من حوسبة الذكاء الاصطناعي إلا من خلال حل مقايضات البنية التحتية الأساسية التي كانت تحد سابقاً من تطبيقات الحوسبة وفهم مجموعات البيانات من البنية التحتية العالمية في الوقت الفعلي. لتقديم التعلم العميق للبيانات، تقدم فاست داتا اليوم منصتها.
تم بناء منصة فاست داتا مع وضع مجموعة البيانات الكاملة للبيانات الطبيعية في الاعتبار – أنواع البيانات غير المنظمة والمنظمة في شكل فيديو وصور ونصوص مجانية وتدفقات بيانات وبيانات أجهزة – تم إنشاؤها من جميع أنحاء العالم ومعالجتها مقابل مجموعة بيانات عالمية كاملة في الوقت الفعلي. يهدف هذا النهج إلى سد الفجوة بين البنى القائمة على الأحداث والبيانات من خلال توفير القدرة على:
- الوصول إلى البيانات ومعالجتها في أي مركز بيانات سحابي عام خاص أو رئيسي
- فهم البيانات الطبيعية من خلال تضمين طبقة دلالية قابلة للاستجواب في البيانات نفسها
- حساب البيانات بشكل مستمر ومتكرر في الوقت الفعلي، مع التطور لكل تفاعل
لأكثر من سبع سنوات، كانت فاست تبني نحو رؤية تضع البيانات – البيانات الطبيعية والبيانات الوصفية الغنية والوظائف والمحفزات – في قلب بنية الأنظمة الموزعة المفصلة والمشتركة (DASE). تضع DASE أساس البيانات للتعلم العميق من خلال القضاء على مقايضات الأداء والقدرة والنطاق والبساطة والمرونة لجعل من الممكن تدريب النماذج على جميع بيانات المؤسسة. من خلال السماح للعملاء الآن بإضافة منطق إلى النظام – يمكن للآلات إثراء وفهم البيانات من العالم الطبيعي بشكل مستمر ومتكرر.
محرك حوسبة عالمي موحد للبيانات وقاعدة البيانات والذكاء الاصطناعي
لالتقاط البيانات من العالم الطبيعي وتقديمها، صممت فاست أولاً أساس منصتها، مخزن بيانات فاست، وهي بنية تخزين قابلة للتطوير للبيانات غير المنظمة التي تلغي مستويات التخزين. من خلال الكشف عن واجهات تخزين ملفات المؤسسة وتخزين الكائنات، حيث يعد مخزن بيانات عبارة عن منصة تخزين متصلة بشبكة المؤسسة تم بناؤها لتلبية احتياجات هياكل الحوسبة القوية للذكاء الاصطناعي اليوم، مثل أجهزة الكمبيوتر العملاقة نفيديا دي جي إكس سوبر بي او دي أي آي (NVIDIA DGX SuperPOD AI)، بالإضافة إلى البيانات الضخمة الرائدة عالمياً ومنصات الحوسبة عالية الأداء (HPC). تم بناء مخزن البيانات على نطاق اكسابايت (exabyte) بكفاءة النظام الأفضل في فئته لجلب اقتصاديات الأرشيف إلى البنية التحتية الوميضية – مما يجعلها مناسبة أيضاً لتطبيقات الأرشيف. كان حل تكلفة التخزين السريع أمراً بالغ الأهمية لوضع الأساس للتعلم العميق لعملاء المؤسسات وهم يتطلعون إلى تدريب النماذج على أصول البيانات الخاصة بهم. حتى الآن، تمكنت فاست من إدارة أكثر من عشرة اكسابايت من البيانات على مستوى العالم مع العملاء الرائدين بما في ذلك بوكينغ دوت كوم (Booking.com) وناسا واستوديوهات بيكسار انيميشن (Pixar Animation) وزووم (Zoom Video Communications) والعديد من الشركات الاخرى.
أضافت فاست طبقة قاعدة بيانات دلالية محلياً إلى النظام مع إدخال قاعدة البيانات الواسعة لتطبيق الهيكل على البيانات الطبيعية غير المنظمة. وذلك من خلال تطبيق تبسيط المبادئ الأولى للبيانات المنظمة من خلال الجمع بين خصائص قاعدة البيانات ومستودع البيانات وبحيرة البيانات في نظام إدارة قاعدة بيانات واحد بسيط وموزع وموحد، حلّت فاست المفاضلات بين المعاملات (لالتقاط البيانات الطبيعية وفهرستها في الوقت الفعلي) والتحليلات (لتحليل البيانات وربطها في الوقت الفعلي). كما تصميم قاعدة البيانات الواسعة لالتقاط البيانات بسرعة والاستفسارات السريعة على أي نطاق، وهو أول نظام يكسر حواجز التحليلات في الوقت الفعلي من تدفق الحدث وصولاً إلى الأرشيف.
مع وجود أساس للبيانات المصنعة المنظمة وغير المنظمة، فإن منصة فاست للبيانات تجعل من الممكن صقل وإثراء البيانات الخام غير المنظمة إلى معلومات منظمة وقابلة للاستفسار مع إضافة دعم للوظائف والمحفزات. حيث إن محرك البيانات الواسع هو محرك تنفيذ وظيفي عالمي يدمج مراكز البيانات والمناطق السحابية في إطار حسابي عالمي واحد. يدعم المحرك لغات البرمجة الشائعة، مثل إس كيو إل (SQL) وبايثون (Python)، ويقدم نظام إشعار الحدث بالإضافة إلى تدريب النموذج المتجسد والقابل للتكرار الذي يسهل إدارة نتائج الذكاء الاصطناعي.
العنصر الأخير في استراتيجية منصة فاست داتا هو فاست داتا سبيس(VAST DataSpace)، وهو مساحة اسمية عالمية تسمح لكل موقع بتخزين البيانات واستردادها ومعالجتها من أي موقع بأداء عالٍ مع فرض اتساق صارم عبر كل نقطة وصول. مع داتا سبيس، يمكن نشر منصة البيانات الواسعة في مراكز البيانات الموجودة في المبنى، والبيئات المتطورة، وهي الآن توسع الوصول إلى منصات السحابة العامة الرائدة بما في ذلك اي دبليو اس (AWS) ومايكروسوفت ازيور (Microsoft Azure) وغوغل كلاود (Google Cloud).
تتخذ منصة الحوسبة العالمية هذه المحددة بالبيانات نهجاً جديداً للجمع بين البيانات غير المنظمة والبيانات المنظمة من خلال تخزين ومعالجة وتوزيع تلك البيانات من نظام واحد موحد.
لكي يقود الذكاء الاصطناعي للمؤسسات وأنظمة نماذج اللغات الكبيرة اكتشافات وتفاهمات جديدة، فإنها تتطلب:
- الوصول المباشر إلى العالم الطبيعي من فاست داتا سبيس، مما يقضي على الاعتماد على الترجمات البطيئة وغير الدقيقة
- القدرة على تخزين كميات هائلة من البيانات الطبيعية غير المنظمة بطريقة يسهل الوصول إليها، من خلال فاست داتا ستور (VAST DataStore)
- الذكاء لتحويل البيانات الخام غير المنظمة إلى فهم لخصائصها الأساسية، من خلال قاست داتا انجن (VAST DataEngine)
- وأخيراً، طريقة للبناء على كل المعرفة العالمية للمؤسسة، والاستعلام عنها، وتوليد فهم أفضل لها، من خلال فاست داتا بيس (VAST DataBase)
وفي هذا السياق صرح رينين هالك، الرئيس التنفيذي والمؤسس المشارك لدى فاست داتا. “من خلال تغليف القدرة على إنشاء وفهرسة الفهم من البيانات الطبيعية على نطاق عالمي، فإننا ندمج فئات البنية التحتية لتكنولوجيا المعلومات بالكامل لتمكين الحقبة التالية من حساب البيانات على نطاق واسع. من خلال منصة البيانات الواسعة، نقوم بإضفاء الطابع الديمقراطي على قدرات الذكاء الاصطناعي وتمكين المنظمات من فتح القيمة الحقيقية لبياناتها. “
يتوفر فاست داتا ستور وداتا بيس وداتا انجن عموماّ داخل منصة البيانات الواسعة اليوم، وسيتم توفير محرك البيانات الواسع في عام 2024.