Skip to main content

لغات البرمجة الإحصائية SPSS و R و SAS و Python.


يدخل الإحصاء  في كثير من الاختصاصات العلمية كأداة من أهم أدوات البحث العلمي وتحليل البيانات بهدف استخلاص النتائج وإيجاد العلاقات الرياضية بين المتحولات. ولا بد أن أي طالب علم أو باحث قد سمع بما يسمى لغات البرمجة الاحصائية التي تستعمل لتطبيق القوانين الاحصائية على البيانات ومن أشهر هذه اللغات SAS, SPSS, R و Python.

 تعتبر اللغتان  SAS و  SPSS الأكثر شهرة بين الباحثين لأن أغلب الجامعات تشتري رخص استخدام وتتيحها للباحثين مجاناً. المهتمون بالبرمجيات المجانية والبرمجيات مفتوحة المصدر يفضلون استخدام لغة R والتي تلاقي انتشاراً واسعاً هذه الأيام حتى أن البرمجيات التجارية تتيح تصدير البيانات والاتصال مع R و Python.

  • SAS هو اختصار Statistical Analysis System أو نظام التحليل الاحصائي وهو برنامج طور في جامعة North  Carolina State University وأول ما طور كان بهدف تحيل البيانات الزراعية كبيرة الحجم ثم استقلت شركة SAS كأسم تجاري مستقل منذ 1976 
  • SPSS هو اختصار لـ  Statistical Package for the Social Sciences المطور للعلوم الاجتماعية وهو أول لغة برمجة إحصائية للحواسب الشخصية وقد طور في جامعة  Stanford عام 1968 ثم استقل في شركة خاصة باسم SPSS Inc. وبعدها اشترته  شركة IBM منذ 2009
  • جامعة Auckland طورت لغة البرجة R تحت رخصة المشاع GNU للتركيز على النمذجة الاحصائية في العام 2000.
  • اللغة الوحيدة التي لم تطور في أي جامعة هي لغة Python فقد طورها شخص ألماني يحب مجموعة بريطانية للكوميديا السيريالية قامت بابتداع سيرك باسم  مونتي بايثون الطائر وهو سبب التسمية وقد حرص على تبسيطها كلغة برمجة وهي ليست لغة احصائية لكنها تقبل إضافة الكثير من الـ Modules والتي تعتبر الوحدات الإحصائية من أهمها ما جعل لغة بايثون تصنف ضمن مجال لغات البرمجة الاحصائية.
أحاول في هذه التدوية تبيين مميزات كل من هذه اللغات.
  • بالنسبة للسعر تعتبر كل من SPSS و SAS ذات سعر مرتفع نسبياً بينما R و Python فمجانيتين. لكن SPSS و SAS أكثر انتشاراً لأنهما أبسط في التعامل وواجهاتهما الرسومية GUI  أبسط وتغني عن كتابة أي كود برمجي وبالتالي يمكن تعلمهما بسهولة أكبر بالمقارنة مع R و Python التي تحتاج لمهارات برمجية. ولعل تعلم لغة R هو الأصعب للمبتدئين لكن التقدم فيها يصبح أسهل بعد فهم المبادئ. ومن الجدير بالذكر أنه بالرغم من صحة أن Python تعتبر لغة بسيطة لكن الخصائص الاحصائية المضافة ليست بهذه السهولة.
  • بالنسبة للدعم الفني:  طبعاً كل من SPSS و SAS مدعومتان من شركات تجارية توفر فريقاً للدعم الفني. لكن بالمقابل فإن شعبية المصادر المفتوحة توفر عدداً كبيراً من المستخدمين الذين يتعاونون عبر مواقع الأسئلة والمنتديات ليجيبوا على الأسئلة المطروحة.  
  • قد لا تكون الواجهات الرسومية لـ R و Python بدرجة الاحترافية التي تقدمها SPSS و SAS لكن وجود خيارات متعددة وامكانيات التعديل في موديولات مثل ggplot2 وRattle  لـ R وكل من  ggplot-module  و Matplotlib في Python قد تجعلها خياراً أفضل للمطورين المحترفين.
  • Python هي بيئة تطويرية متعددة الأغراض والمهام ما يعطيها القوة. كما أنها مصممة لدعم التطبيقات applications ومن المزايا الاحصائية لها أنها تدعم التعلم الآلي.
  • تملك R مكتبات (reticulate, rPython) لدعم البرامج المكتوبة في Python كما وتدعم Python تشغيل البرامج المكتوبة بلغة R من خلال مكتبة (rpy2)  مم يجعل البيئتين متكاملتين وقابلتين للاستخدام معاً
  • يمكن تقسيم تحليل البيانات إلى قسمين أساسيين: الأول هو وصف البيانات والنماذج الرياضية المحددة لعلاقاتها ببعضها. والثاني هو التنبؤ الرياضي. بمعنى آخر أن تحليل البيانات يهدف للإجابة على سؤالين: الأول لماذا تحدث ظاهرة محددة من خلال البيانات المعروضة؟ والسؤال الثاني هو ما هو الفعل أو الصنف الذي سيحدث بناء على معطيات معينة. فالسؤال الأول يهدف لوصف الظاهرة، بينما السؤال الثاني هو توقع ما سيحدث. والتوقع هو الدراسة الأقرب للتعلم الآلي machine learning  أو ما يسمى التنقيب في البيانات Data mining.
    كل من 
    SPSS و SAS تم تطويرهما في الأساس في بيئة أكاديمية من أجل تطبيقات تركز على وصف البيانات. حالياً يملك كل مهما أدوات كـ  SAS Enterprise Miner and SPSS Modeler لكن يحتاج المرء لدفع سعر إضافي للحصول على ترخيص استخدام هذه الميزات. وهنا تبرز أفضلية للبرامج مفتوحة المصدر في أنها دائما قيد التطوير والتحديث والإضافة من قبل مجتمع كبير ومتعدد المتطلبات. مما يجعل المشاركات أكبر ويعطي لـ R ميزات قوية في المجالين الوصفي والتنبئي.
    بالنسبة لـ
    Python فهو يدعم التطبيقات التجارية ويركز بشكل أكبر على الإحصاء التنيبئي وتطبيقات البيانات الكبيرة big data.

Comments

Popular posts from this blog

أصل ونسب آل السباعي في حمص

أصل ونسب آل السباعي في حمص في عدد من المواقع التي تتناول عوائل حمص وفي بعض المواقع التي تتناول ما يعرف بالأشراف تكرر ما يلي ولا أعلم مدى صحته حيث أنني لم أرى الوثيقة المذكورة: بتاريخ 24 جمادى الأول 1407 هـ 24/01/1987 أرسل الحاج الشيخ نسيب بن عبد الرحيم سعيد الجابي السباعي رسالة الى أسرة آل السباعي يوضح فيها الحسب والنسب وفيها : أن الجد الأعلى لعائلتنا السباعي في بلاد الشام هو سيدي السيد عبد القدوس السباعي ، وكان حضر الى حمص – سورية قبل ألف ومائة سنة تقريباً وقد ذكر بأنه قدم من بلدة ساقية الحمراء – الواقعه قرب مراكش في المغرب وانه يحمل مستنداً (شجرة) تفيد بأنه من أحفاد سيدنا إدريس بن سيدنا الحسن بن سيدنا علي بن أبي طالب رضي الله عنهم أجمعين .وأن جدة سيدنا أدريس هي سيدتنا وسيدة نساء الجنه فاطمة الزهراء – إبنة سيدنا رسول الله محمد بن عبد الله الصداق الأمين وإن سيدي عبد القدوس ذكر بأن جده الأعلى سيدنا إدريس كان فر من الأمويين لعزمهم على إغتياله وأنه لجأ الى أمير البربر في المغرب وقد تزوج أبنة أمير البربر وأن الله سبحانه وتعالى قد بارك بذريته وإنتشر أفرادها في شمال أفريقيا و

مشاهدات يابانية

في هذه التدوينة أحاول تجميع بعض مزايا المجتمع الياباني التي لمستها أثناء إقامتي في اليابان لمدة سبع سنوات ونيف والتي أرى أنها بشكل أو بآخر من أسباب تطور اليابان. هذه المشاهدات لعلها تعد عامة أمام تصرفهم في الكوارث. إن القوة الحقيقية المذهلة في هذا المجتمع كانت أبرز في مشاهداتي أثناء حادثة زلزال فوكوشيما . ولقد ذكرالاعلامي أحمد الشقيري في برنامجه خواطر كثيراً من ميزات هذا المجتمع لكن تبقى بعض التفاصيل الصغيرة أو الروتينية في الأوقات العادية ويبقى هناك الكثير ليقال مم لا يتسع له مقال وهذا بعضه: