ما هي الأرقام الأكثر استعمالاً؟
يمكن تطبيق منهجية بسيطة تقوم على حساب مقدار تواتر الأرقام في الحسابات الختامية من أجل كشف تزوير بيانات الشركات أو ميزانيّات مدفوعات الدول، وهو ما يعرف بقانون بنفورد ويجهله أغلب الناس في العالَم.
ما هي الأرقام الأكثر استعمالاً؟
لاحظَ عالِم الرياضيّات سايمون نيوكومب في القرن التاسع عشر أنّ جداول اللوغاريتمات الأكثر استعمالًا تقع في الصفحات الأولى، فاستنتج أنّ الأعداد المحيطة بنا تبدأ برقمٍ صغير في الغالب، وقد أصدر سايمون نيوكومب قانونًا لتوزيع الأرقام في عام 1881، ثمّ عاد عالِم الفيزياء فرانك بنفورد في العام 1938 باكتشاف هذه الظاهرة من جديد، عندما درس بيانات جمعها من مصادر عديدة شملت أرقام شوارع، وارتفاع المباني، وأرقام واردة في إحدى المجلات، وتبيّن أّنّ كثير من تلك البيانات موزّعة وفق قانون التوزيع لسايمون نيوكومب.
الدلالة الكونيّة والطبيعيّة لقانون التوزيع
عُرِف القانون في الأوساط العلمية بقانون بنفورد، وعكف علماء الرياضيات خلال العقود التالية لاستنتاجه على دراسته واستنتاج خواصّه وكانت أهمّ تلك الخواصّ أنّه قانون ثابت حتى وإنْ تغيّرت وحدات القياس، أي إنّ قياسات ارتفاع المباني مثلًا اتّبعت دومًا قانون بنفورد سواء قِيست بالأمتار أمْ بالأقدام.
لاحَظَ العلماء بدءًا من بنفورد نفسه وحتّى بداية الألفية الجديدة أنّ دمج مجموعات البيانات المختلفة غير ذات الصلة فيما بينها يُعطي مجموعة جديدة من البيانات التي تتبع هذا القانون أيضًا.
وقد امتدّ أثر قانون بنفورد إلى الاقتصاد، حيث لاحظَ الاقتصاديّ بيرسي دياكوني في سبعينيات القرن الماضي أنّ تسلسل الأرقام الاقتصادية مثل متتالية الناتج المحلّي الإجمالي عامًا بعد عام، كادت جميعها تكون موزّعة وفق قانون بنفورد.
دور قانون بنفورد في كشف عمليّات تزوير البيانات الحسابيّة
يمكن التأكّد من صحّة البيانات الاقتصاديّة بالتأكّد من توزيع البيانات على نحوٍ معقول وفق قانون بنفورد، وهذا ما بات ممكنًا بواسطة اختبار يُسمّى “تصحيح مربّع خي”، وقد طبّقت الأمر بشكلٍ ناجح السلطات القضائية في مدينة نيويورك وتمكّنت من كشف وإدانة سبع منشآت زوّرت بياناتها الحسابية الختامية.
ومن الأمور الطريفة التي توضّح أهمّية قانون بنفورد عليك أن تعلم أنّ المفوضية الأوروبية تنظّم مؤتمرًا حول أسس قانون بنفورد وأساليبه وتطبيقاته.
كيف تتوزّع الأرقام وفق توزيع بنفورد
نسبة استعمال الرقم (1) في الخانة الأولى هي الأعلى وتحتلّ 30% بينما يأتي الرقم (2) في المرتبة الثانية بنسبة استعمال حوالي 18%، ثمّ الرقم (3) بنسبة 12% تقريبًا، أي إنّ أوّل ثلاثة أرقام تٌستخدم بنسبة 60% بينما تبقى 40% للأرقام الستة الباقية، حيث تتناقص النسبة تدريجيًا لتصل إلى 4,5% فقط للرقم (9)
مصادر
https://www.journalofaccountancy.com/issues/1999/may/nigrini.html
https://ec.europa.eu/jrc/en/event/workshop/benfords-law-conference