ثقافة إقتصادية
ما "بحيرات البيانات"؟ وكيف تستفيد منها الشركات؟
2020/03/28 أرقام
إذا سألت أحد المولعين بالتكنولوجيا عن التحدي الرئيسي الذي يواجهه في التعامل مع البيانات، فإن رده سيكون "العثور على نسخة واحدة للحقيقة".
وكان ذلك هدف شركات تكنولوجيا المعلومات منذ ظهورها قبل 60 عاما، وهو أيضا التحدي الرئيسي أمام الشركات في اقتصاد البيانات، فقد أصبح العثور على الحقيقة الرقمية التي تعرِّف وتجمع البيانات أكثر صعوبة وأهمية أيضا نظرا لأن البيانات ومصادرها تتضاعف باستمرار.
وأهمية ذلك هي أن الشركات تحتاج إلى بناء مستودعات بياناتها الخاصة من أجل أن تستفيد من الذكاء الصناعي "الذي يعزز الإيرادات والأرباح" وفقا لدراسة حديثة لشركة ماكينزي للاستشارات.
ولحسن الحظ وصلت التكنولوجيا إلى طوق النجاة وهي برمجيات معالجة البيانات والحوسبة السحابية التي توفر ما يصفه جورج جيلبرت، المستثمر والخبير بصناعة تكنولوجيا المعلومات، بأنه "خط تجميع للذكاء الصناعي".
بالأمس كانت الكهرباء
وهنا يشير جيلبرت إلى ما حدث قبل مئة عام عندما حلت الكهرباء محل البخار لتصبح المصدر الرئيسي للطاقة في المصانع.
فقبل ذلك، كان ينبغي جمع الآلات قرب مصدر الطاقة وهو المحرك البخاري ثم جاءت الكهرباء لتسمح بتوزيع الطاقة إلى مواقع متعددة مما جعل خطوط التجميع أمرا ممكنا.
وما يحدث الآن هو العكس بالضبط؛ آلات العصر الرقمي -وهي التطبيقات والبرمجيات التي تملكها الشركة- يعاد تجميعها بشكل افتراضي حول مصدر طاقة جديد وهو مستودعات رقمية مركزية تعرف باسم "مستودعات البيانات" أو "بحيرات البيانات".
وفي النهاية ستسمح هذه المستودعات للشركات ببناء توائم شركات رقمية مثلها بالكامل.
دمج البيانات يزداد صعوبة و"أهمية"
صعوبة العثور على الحقيقة الرقمية هي أن البيانات تأتي من مصادر عديدة وبأشكال متنوعة بشكل مذهل وهو ما يجعل دمجها أمرا صعبا. حتى إن أمورا بسيطة كاسم عميل مثلا يمكن تعريفه وتخزينه بعدة وسائل مختلفة.
ويمكن للشركات أن تمتلك آلاف التطبيقات البرمجية ولكل من هذه التطبيقات قواعد بياناتها الخاصة. وقد أدت محاولات فاشلة لدمج أو ربط هذه المستودعات الرقمية إلى استغناء شركات عن أعداد ضخمة من الموظفين المسؤولين عن المعلومات.
كان دمج البيانات مشكلة رئيسية بالفعل عندما وُجدت في الأساس لتعقب "معاملات" الشركة المالية مثل معالجة "طلبية" أو إدارة سلسلة إمداد.
وفي التسعينيات، بدأت الشركات في استخدام البيانات لتحديد مستوى الأداء في نهج أُطلق عليه اسم "التحليلات".
وقبل عشرة أعوام، بدأت الشركات في التنقيب عن البيانات للوصول إلى تنبؤات عن نشاطها في نهج آخر أطلق عليه في بادئ الأمر اسم "البيانات الكبيرة" ويسمى حاليا "الذكاء الصناعي".
واليوم لا تقتصر بيانات شركة ما على قواعد بيانات محلية لكنها توجد في خدمات سحابية مختلفة وتأتي من أطراف ثالثة وأجهزة موصولة.
إنها مستودعات البيانات أو بحيرات البيانات التي تسهل الآن استخدام البيانات. فهي تختلف في الطريقة التي ترتب بها البيانات لكن النوعين يعيشان الآن في الخدمات السحابية.
هذا لا يجعلها رخيصة وحسب بل يتيح مدها ببيانات من مصادر عديدة ومختلفة ويتيحها للاستخدام أمام العديد من المستخدمين.
تنتج شركة "سنوفليك" إحدى هذه الوسائل، فهي تحول مستودع بياناتها إلى ما تسميه بـ"منصة بيانات" تستطيع أن تتصل بعدة خدمات للحوسبة السحابية.
وتقدم شركات كبيرة للحوسبة السحابية مثل أمازون ويب سيرفسيز ومايكروسوفت أزور منتجات مشابهة.
أشكال متعددة
ظهر تطور جديد هو قواعد البيانات المتخصصة التي تهتم بأنواع محددة من البيانات. فشركة "كونفلوينت" تبيع خدمات سحابية تعتمد على برنامج "أباتشي كافكا" مفتوح المصدر، حيث تحلل البيانات الواردة وتلقيها في بحيرات البيانات.
وتستعين شركة "بوش" الألمانية الكبيرة بخدمة "كونفلوينت" لجمع والتنقيب عن البيانات من أدوات الطاقة لمساعدتها على إصلاح الخدمات وفي مواقع التشييد.
لكن مجموعة ثالثة من البرمجيات والخدمات هي التي تحول كل هذا إلى "خط تجميع الذكاء الصناعي" كما يسميه جيلبرت.
فبعض هذه الأدوات تجهز البيانات لمعالجتها وأدوات أخرى تسهل عملية تصميم خوارزمية (حل حسابي) ووضعها في تطبيق ليجعلها جاهزة لاتخاذ قرارات بشكل تلقائي.
وصممت شركة شل النفطية خوارزميات تتيح لها التأكد من أن الآلاف من قطع الغيار لديها متاحة دوما في أنحاء العالم.
كما شيدت شركة كيفا -وهي مؤسسة للإقراض لا تهدف للربح- مستودعا للبيانات بالتعاون مع "سنوفليك" يتيح لها اتخاذ القرارات بدرجة أفضل بشأن من يستحقون القروض.
ولم يحالف الحظ شركات أخرى لم تنتبه إلى أن التكنولوجيا هي فقط جزء من الحل. وبعد دراسات خلصت إلى أن الذكاء الصناعي يدعم الأرباح وأيضا بدافع الذعر في بعض الأحيان من حدوث تعطيل في حال الاستعانة بشركات أخرى، حاولت بعض الشركات صناعة خطوط تجميع للذكاء الصناعي خاصة بها لكنها فشلت.
فهي لم تستعن بالمطورين أو خبراء البيانات المناسبين أو ربما أحجمت عن الاستعانة بخبراء يتقاضون أجورا باهظة.
معضلة مشاركة البيانات
وتقدم أوراكل الرائدة على مستوى العالم في "قواعد البيانات العلائقية" ما تطلق عليه اسم "قاعدة بيانات مستقلة".
يجمع هذا النوع من الخدمات كل أنواع المستودعات الرقمية وأجزاءً من الذكاء الصناعي حتى لا يحتاج الزبائن لوضع كل هذه البرامج بأنفسهم.
ويقول بول سوندريجر مسؤول البيانات في الشركة "إنها محركات بيانات عديدة في محرك منفرد" مضيفا أن مثل هذا الدمج مهم لزيادة " إنتاجية البيانات " والأرباح.
وأنفقت سيلزفورس مليارات الدولارات في العامين الماضيين لتطوير تكنولوجيا الذكاء الصناعي الخاصة بها وتحمل اسم أينشتاين واستحوذت أيضا على شركتين للبيانات الكبيرة هما موليسوفت وتابليو.
ويقول بريت تيلور رئيس سيلزفورس إن الفكرة هي السماح للشركات بجمع وربط بياناتها حتى يكون لديها "رؤية واحدة عن زبائنها".
لكن ديبرا لوجان التي تعمل في جارتنر وهي شركة لأبحاث السوق تقول إنه رغم هذه الأدوات، إلا أن العديد من مشروعات الذكاء الصناعي لا تزال مثيرة للإحباط. فتوجد مشكلة كبيرة هي مخازن البيانات التي تعكس حدود الشركة الداخلية.
فأقسام عديدة داخل شركة واحدة، وبدافع الخوف من التنازل عن الطاقة، ترفض مشاركة بياناتها أو تغيير ما تقوم بجمعه.
وتسبب ذلك في بقاء العديد من الشركات بعيدة عن تطوير "استراتيجية بيانات" متماسكة لتحقيق أهدافها الاستثمارية.
وللتغلب على مثل هذه الانقسامات الرقمية أجرت بعض الشركات تغييرات تنظيمية وعينت عددا متزايدا في مواقع "كبير مسؤولي البيانات" لتنسيق العمل بين وحدات الذكاء الصناعي وغيرها من الوحدات الاستثمارية لبناء "خط تجميع الذكاء الصناعي".