بالطبع، يوجد الكثير من محلّلي الأعمال الذين يستفيدون من طرائق التنقيب في المعطيات. فالتنقيب في المعطيات يقلّص من الشكّ الناتج عن إجراء عمل خاص عن طريق تحديد النماذج و علاقات الربط الموجودة بين المتحولات المفاتيح. تزيد بالتأكيد هذه المعلومات من فهم صنّاع القرار عن أسباب حصول أحداث معينّة وتمكنهم من توقّع ما سيحدث في المستقبل.
لكن يجب علينا الانتباه إلى أمر هامّ هنا، و هو أنّ التنقيب في المعطيات غير مناسب لجميع متطلّبات تحليل الأعمال. فصنّاع القرار سيحتاجون و بشكل كبير إلى قوّة مكعّبات OLAP cubes، أو إلى تقاريّر جيدة تستطيع الإجابة على أسئلة الأعمال.
مقارنة لقواعد معطيات ذكاء الأعمال مايكروسوفت Microsoft، و أوراكل Oracle، و إي بي إم IBM
تقدّم الشركات الثلاث: مايكروسوفت Microsoft، أوراكل Oracle و إي بي إم IBM، قواعد معطيات علاقاتيّة كأساس لمنصات ذكاء الأعمال المتعلقة بها. قواعد المعطيات التي تقدمها هذا الشركات هي على الترتيب: Microsoft SQL Server, IBM DB2 Universal Database (UDB)، و Oracle 10g. تقدم قواعد المعطيات هذه جميعها إمكانيّات ممتازة خاصة بمخازن المعطيات العلاقاتيّة، إضافةً إلى إمكانيّات الـ OLAP من أجل مخازن المعطيات، و إمكانيّات التنقيب في المعطيات، وأخيراً إمكانيّات البناء و الإدارة.
بالنسبة لمايكروسوفت Microsoft، فلقد تمّ تضمين جميع مكوّنات منصّة ذكاء الأعمال ضمن قاعدة المعطيات SQL Server 2000. و قد تميّزت قاعدة المعطيات هذه بسهولة الاستخدام مقارنةً مع IBM و Oracle، بالإضافة إلى إمكانيّات البناء و الإدارة، وتحسين الأداء. لكن توجد نقاط ضعف أساسيّة تتعلق بالأداء و التدرجيّة scalability، وقد تمّ إجراء تحسينات على بنية محرك قاعدة المعطيات وإضافة العديد من المزايا المتعلقة بمخازن المعطيات للتغلب على هذه المشكلة.
أما بالنسبة لأوراكل Oracle فلقد اعتمدت على قاعدة معطيات علاقاتيّة و غرضيّة التوجّه، تميّزت بوجود مزايا ممتازة متعلقّة بمخازن المعطيات (خاصّة تلك الموجّهة للتطبيقات النهائيّة) أهمها: وجود مجال واسع لأنماط الفهرسة، و قدرات الربط الغنيّة، و طرق التقسيم partitioning المتعدّدة.
لكن كلّ هذه الميّزات تمّ رزمها و تسعيرها بشكل منفصل عن قاعدة معطيات أوراكل، و هو ما أدى إلى زيادة كلفة استخدام ذكاء الأعمال الخاص بأوراكل.
وأخيراً، فبالنسبة لشركة إي بي إم IBM، فكما ذكرنا سابقاً، اعتمدت على قاعدة المعطيات DB2 Universal Database (UDB)، والتي بإمكانها تقديم دعم كبير لتطبيقات ذكاء الأعمال، و تقديم أدوات إداريّة فعّالة. أما الأداة DB2 OLAP Server فتزوّدنا بقاعدة معطيات ذكاء الأعمال من أجل الـOLAP. وقد اشترت شركة IBM هذه الأداة من شركة هايبريون Hyperion، لهذا السبب لم تكن متكاملة بشكل قوي مع منصة ذكاء الأعمال الخاصة بـIBM. فهي بحاجة لأدوات إدارة وبناء منفصلة غير مدعومة من قبل أدوات التنقيب في المعطيات الخاصة بالشركة.
مقارنة لأدوات التنقيب في المعطيات بين مايكروسوفت Microsoft، و أوراكل Oracle، و إي بي إم IBM
قامت مايكروسوفت Microsoft وابتداءً من الإصدار SQL Server 2000 بإضافة ميّزات التنقيب في المعطيات إلى وظائف رزمة OLAP الموجودة ضمن SQL Server Analysis Services. أما الميّزات التي تمّ تضمينها فهي: التحزيم packaging، والتضمين ضمن منصة ذكاء الأعمال الخاصّة بمايكروسوفت، وبناء النماذج باستخدام المعالجات، و القدرة على التنقيب ضمن معطيات علاقاتيّة، أو OLAP، أو OLE DB خارجيّة. لكن من ناحية أخرى لا تدعم أدوات Analysis Services إلا خوارزميّتين من خوارزميات التنقيب في المعطيات هما: أشجار القرار decision trees، و التجميع clustering. وعلى الرغم من إمكانيّة تطبيق هاتين الخوارزميّتان لحلّ العديد من مشاكل التوقّع prediction،
إلا أنّ إضافة خوارزميات أخرى سيعطي المزيد من المرونة ويوسّع مجال المشاكل التي نستطيع حلّها.
نقطة أخرى نوّد ذكرها هنا هي أنّ الأداة Analysis Services تدعم توصيف لغة تأشير النماذج التوقعيّة
(Predictive Model Markup Language (PMML و التي تساعد على التبادل بين نماذج التنقيب في المعطيات. IBM Intelligent Miner و Oracle Data Mining يدعمان أيضاً PMML.
أما بالنسبة لأوراكل Oracle فلقد بُدىء بنشر إمكانيات التنقيب في المعطيات من خلال الأداة Oracle9i Data Mining. ولقد جرى الاعتماد على تقنية داروين Darwin technology التي قامت شركة أوراكل بشرائها من شركة Thinking Machines في حزيران 1999. تمّ تنفيذ وظائف التصنيف classification، و التجميع clustering، و قواعد الربط association rules، و أهميّة السمات attribute importance باستخدام الخوارزميات: Bayes Network, Naive Bayes, k-Means, O-Cluster, predictive variance, A priori على الترتيب. أما أهم الميزات التي تمّ تضمينها فكانت مكاملة أدوات التنقيب في المعطيات مع قاعدة معطيات أوراكل، و إمكانية استخدام قاعدة المعطيات كدخل، و استخدام واصف المعطيات metadata، بالإضافة إلى المجال الواسع للتوابع و الخوارزميات المضمّنة. لكن من ناحية أخرى هناك العديد من نقاط الضعف المتعلقة بأدوات التنقيب في المعطيات في أوراكل كعدم وجود أداة لإظهار داليّة المعطيات Data visualization functionality، و عدم وجود دعم لإجراء التنقيب في المعطيات، و عدم توافّر أدوات نمذجة مرئيّة Visual modeling tools.
أما بالنسبة لشركة إي بي إم IBM فلقد سبقت شركتي مايكرو سوفت، و أوراكل في الاهتمام بتقنيات التنقيب في المعطيات. و كان إصدارها الأول الخاص بالتنقيب في المعطيات DB2 Intelligent Miner for Data، والذي سُمي فيما بعد Intelligent Miner من أوائل أدوات التنقيب في المعطيات. ولقد احتوى هذا الإصدار على ثلاثة مكوّنات رئيسيّة هي:
DB2 Intelligent Miner Visualization
DB2 Intelligent Miner Modeling
DB2 Intelligent Miner Scoring
يدعم كلّ مكوّن مرحلة أساسيّة ضمن إجراء التنقيب في المعطيات التقليدي. تتركّز قوّة DB2 Intelligent Miner بقوة وعمق خوارزميات التنقيب في المعطيات المستخدمة، و قدرته على تقسيم و تغطية إجراء التنقيب في المعطيات. أما قيوده فتتلخص بتعقيده، و دعمه للدخل العلاقاتي فقط.
يتضمّن DB2 OLAP Server الأداة DB2 OLAP Miner. تقوم هذه الأداة بتطبيق تقنيات التنقيب في المعطيات على الـ OLAP. بشكل أدقّ، فهي تقوم باستخدام خوارزميّة إحصائيّة وحيدة لاكتشاف الخلايا الموجودة ضمن dimension OLAP و التي تحتوي على قيم غير متوقّعة و تقوم بعرضها على المحلّلين بشكل مرئي. يستطيع بعدها المحلّل استخدام تقنيات OLAP التقليديّة لتحديد و فهم أسباب اختلافات القيم. و هذا تطبيق هام جداً في مجال التنقيب في المعطيات، فهو يؤتمت إجراءً هاماً من إجراءات ذكاء الأعمال، و يجعل نتائج هذا الإجراء متناسقة. بالإضافة إلى ذلك، لا تحتاج هذه الأداة إلى خبرة أو مهارة في مجال التنقيب في المعطيات. كلّ ما تحتاجه هو أن تمتلك خبرة باستخدام أدوات الـOLAP.
تمّ طرح DB2 OLAP Server Miner في شهر تشرين الثاني العام 2001. ولقد اعتبر هذا المنتج أحد أقوى المنتجات التي تمّ طرحها، فلقد استخدم العديد من خوارزميات التنقيب في المعطيات المتقدّمة، والتي ميّزته عن تلك التي تمّ طرحها من قبل شركتي مايكرو سوفت و أوراكل. أما سيئاته فتتلخص بعدم قدرته على التنقيب ضمن معطيات الـOLAP، و بكون الأداة DB2 OLAP Miner تمتلك خوارزمية وحيدة للتنقيب في المعطيات