![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/c/c3/Histogram_of_arrivals_per_minute.svg/langms-640px-Histogram_of_arrivals_per_minute.svg.png&w=640&q=50)
Histogram
From Wikipedia, the free encyclopedia
Histogram ialah perwakilan anggaran taburan data berangka. Istilah ini mula diperkenalkan oleh Karl Pearson.[1] Untuk membina histogram, langkah pertama ialah mengelompokkan (bin) julat, yakni membahagikan keseluruhan julat nilai kepada satu siri selang—dan kemudian mengira berapa banyak nilai yang jatuh ke dalam setiap selang. Kelompok ini biasanya ditentukan sebagai selang berturut-turut dan tidak bertindih bagi sesebuah pemboleh ubah. Selang mestilah bersebelahan dan selalunya (tetapi tidak perlu) mempunyai saiz yang sama.[2]
Jika selang mempunyai saiz yang sama, segi empat tepat didirikan di atas selang dengan ketinggian berkadar dengan kekerapan — bilangan kes dalam setiap selang. Histogram juga boleh dinormalkan untuk memaparkan frekuensi "relatif". Ia kemudian menunjukkan perkadaran kes yang termasuk dalam setiap beberapa kategori, dengan jumlah ketinggian bersamaan 1.
Walau bagaimanapun, selang-selang tidak semestinya mempunyai lebar yang sama; dalam kes itu, segi empat tepat yang didirikan ditakrifkan mempunyai luasnya berkadar dengan kekerapan kes dalam tong.[3] Paksi menegak kemudiannya bukan mewakili kekerapan tetapi ketumpatan frekuensi — bilangan kes per unit pemboleh ubah pada paksi mendatar.
Oleh kerana selang bersebelahan tidak meninggalkan jurang, segi empat tepat histogram akan bersentuhan antara satu sama lain untuk menunjukkan bahawa pemboleh ubah asal bersifat berterusan (berselanjar).[4]
Histogram memberikan gambaran kasar tentang ketumpatan taburan asas data, dan selalunya dalam anggaran ketumpatan: menganggar fungsi ketumpatan kebarangkalian pemboleh ubah asas. Jumlah luas histogram yang digunakan untuk ketumpatan kebarangkalian sentiasa dinormalkan kepada 1. Jika panjang selang pada paksi-x semuanya 1, maka histogram adalah sama dengan plot frekuensi relatif.
Histogram ialah salah satu daripada tujuh alat asas kawalan kualiti.[5]
Histogram kadangkala dikelirukan dengan carta bar. Histogram digunakan bagi data selanjar, di mana selang mewakili julat data, manakala carta bar ialah plot bagi pemboleh ubah kategori. Sesetengah pengarang mengesyorkan bahawa carta bar mempunyai jurang antara segi empat tepat untuk menampakkan perbezaan.[6][7]