Terkadang anda memiliki pikiran bahwa dalam kumpulan data numerik, dan dalam semua digit memiliki peluang yang sama untuk muncul. Namun, faktanya, ada sebuah prinsip statistika yang membuktikan sebaliknya. Prinsip tersebut dikenal sebagai Hukum Benford (Benford Law), aturan ini mengungkapkan ada sebuah anomali menarik, yang dimana angka 1, 2, dan 3 cenderung muncul sebagai digit pertama jauh lebih sering daripada angka 7, 8, atau 9. Fenomena ini, yang berlaku untuk berbagai set data alami, mulai dari data keuangan perusahaan hingga jumlah penduduk kota. Dari hukum ini menawarkan perspektif yang sangat kuat, terutama ketika diterapkan dalam visualisasi data. Artikel ini akan mengupas bagaimana visualisasi dapat mengungkap kebenaran di balik Hukum Benford dan memanfaatkannya untuk mendeteksi kecurangan.

Memvisualisasikan data yang mengikuti Hukum Benford adalah cara paling efektif untuk mengidentifikasi anomali. Cara terbaik untuk melakukannya adalah dengan membuat diagram batang (bar chart) yang membandingkan frekuensi kemunculan digit pertama dari data yang dianalisis dengan frekuensi yang diprediksi oleh Hukum Benford.

Contohnya, Bayangkan Anda sedang mengaudit data laporan pengeluaran sebuah perusahaan. Secara teori, data ini seharusnya mengikuti distribusi Hukum Benford. Anda dapat memplot data tersebut dengan langkah-langkah berikut:

· Ekstrak Digit Pertama: Ambil semua digit pertama dari setiap nilai pengeluaran. Misalnya, dari pengeluaran sebesar Rp1.250.000, ambil angka “1”.

· Hitung Frekuensi: Hitung berapa kali setiap digit (1 hingga 9) muncul sebagai digit pertama.

· Buat Diagram Batang: Buat diagram batang dengan sumbu X mewakili digit (1-9) dan sumbu Y mewakili persentase kemunculan.

Contoh lainnya, dalam sebuah diagram batang, akan memiliki dua set batang/data, satu untuk data perusahaan Anda dan satu lagi untuk data ideal dari Hukum Benford. Jika kedua set batang memiliki pola yang sangat berbeda. Misalnya, batang untuk digit 7, 8, atau 9 pada data perusahaan lebih tinggi dari yang seharusnya. Hal itu menunjukan adanya indikasi kuat adanya kecurangan atau manipulasi.

Sebagai contoh, jika seseorang memalsukan data pengeluaran dengan menaikkan nilai-nilai kecil menjadi ribuan, mereka cenderung memilih angka yang terdistribusi secara lebih merata (misalnya, angka 7, 8, atau 9) karena secara intuitif mereka berpikir itu akan terlihat normal. Visualisasi data ini akan langsung menunjukkan pola abnormal tersebut, yang akan sulit dideteksi hanya dengan melihat tabel angka.

Referensi:

  • Jeffrey D. Camm, James J. Cochran, Michael J. Fry, Jeffrey W. Ohlmann (2025). Data Visualization: Exploring and Explaining with Data. USA: Cengage.