Dalam kebarangkalian dan statistik, sisihan piawai bagi satu-satu taburan kebarangkalian, pembolehubah rawak atau populasi atau banyak set nilai adalah ukuran serakan nilainya. Ia sering diwakili dengan huruf σ (huruf kecil sigma). Ia ditakrifkan sebagai punca kuasa dua varians.

Untuk memahami sisihan piawai, harus diingat bahawa varians adalah purata bagi kuasa dua kepada beza titik data dengan min. Sisihan piawai, yang merupakan punca kuasa dua kuantiti tersebut, lalu mengukur serakan data pada min, yang diukur dengan unit yang sama dengan data.

Lebih rasmi lagi, sisihan piawai ialah sisihan punca min kuasa dua (pmkd) bagi nilai dari min aritmetik mereka.

Sebagai contoh, dalam populasi {4, 8}, min adalah 6 dan sisihan dari min ialah {−2, 2}. Sisihan tersebut dikuasa duakan lalu menjadi {4, 4}, puratanya (varians) adalah 4. Maka, sisihan piawai ialah 2. Dalam kes ini, 100% nilai dalam populasi adalah pada satu sisihan piawai min.

Sisihan piawai adalah pengukuran yang biasa bagi serakan statistik, mengukur betapa lebarnya nilai dalam set data. Jika kebanyakan titik data hampir dengan min, maka sisihan piawai adalah kecil; jika banyak titik data jauh dari min, maka, sisihan piawai adalah besar. Jika semua data adalah sama, maka sisihan piawai adalah sifar.

Bagi satu populasi, sisihan piawai boleh dianggar oleh sisihan piawai yang diubah (s) bagi sampel. Formula adalah diberi di bawah.

Diberi pemboleh ubah rawak (biru), sisihan piawai adalah ukuran serakan nilai pemboleh ubah rawak dari min

Takrifan dan pengiraanSunting

Contoh mudahSunting

Katakan kita ingin mencari sisihan piawai bagi set nombor 4 dan 8.

Langkah 1: cari min aritmetik (atau purata) bagi 4 dan 8,

 

Langkah 2: cari perbezaan antara setiap nombor dengan min,

 
 

Langkah 3: kuasa duakan kedua-dua perbezaan

 
 

Langkah 4: jumlahkan kedua-duanya,

 

Langkah 5: bahagikan jumlah dengan bilangan nombor (sini, kita ada dua nombor),

  = 4.

Langkah 6: ambil punca kuasa yang bukan negatif,

 

Maka, sisihan piawainya ialah 2.

Ciri-ciri sisihan piawaiSunting

1. Semakin data tersebar, semakin besar julat, varians, dan sisihan piawai.

2.

Sisihan piawai bagi pemboleh ubah rawakSunting

Sisihan piawai bagi pemboleh ubah rawak X ditakrifkan sebagai:

 

iaitu E(X) adalah nilai jangkaan bagi X, dan Var(X) ialah Varians X.

Tidak semua pemboleh ubah rawak mempunyai sisihan piawai, memandangkan nilai jangkaan ini tidak wujud. Sebagai contoh, sisihan piawai bagi pemboleh ubah rawak yang mengikut taburan Cauchy adalah tak tertakrif kerana E(X) tidak tertakrif.

Jika pemboleh ubah rawak X mengambil nilai   (iaitu nombor nyata) dengan kebarangkalian sama, maka sishan piawainya boleh dihitung seperti berikut: Pertama, min X,  , ditakrifkan sebagai jumlah:

 

iaitu N adalah bilangan sampel yang diambil. Kemudian, sisihan piawai dimudahkan kepada

 

Dalam kata lain, sisihan piawai bagi pemboleh ubah rawak X yang diskret dan seragam boleh dikira seperti berikut:

  1. Bagi setiap nilai   hitung beza   between xi dan purata nilai  .
  2. Kirakan kuasa dua bagi beza tersebut.
  3. Cari purata beza yang telah dikuasa duakan. Kuantiti ini adalah varians σ2.
  4. Punca kuasa duakan varians itu.

Pernyataan di atas boleh digantikan dengan

 

Kesamaan kedua-dua pernyataan boleh ditunjukkan dengan sedikit algebra:

 

Menganggar sisihan piawai populasi dari sisihan piawai sampelSunting

Dalam dunia nyata, mencari sisihan piawai bagi keseluruhan populasi adalah tidak realistik kecuali dalam kes tertentu, seperti pengujian terpiawai, iaitu setiap ahli populasi disampelkan. Dalam kebanyakan kes, sisihan piawai dianggar dengan memeriksa sampel rawak yang diambil dari populasi. Ukuran yang paling biasa digunakan ialah sisihan piawal sampel, yang ditakrifkan oleh

 

iaitu   merupakan sampel dan   adalah min sampel. Pembawah N − 1 adalah darjah kebebasan dalam vektor  .

Sebab bagi takrifan itu ialah s2 merupakan penganggar tak pincang bagi varians σ2 untuk populasi asal, jika varians wujud dan nilai sampel yang diambil tidak bergantung kepada gantinya. Walau bagaimanapun, s bukanlah bukan penganggar tak pincang bagi sisihan piawai σ; ia cenderung untuk tidak memgendahkan sisihan piawai populasi. Walaupun penganggar tak pincang bagi σ diketahui apabibla pemboleh ubah rawak adalah ditabur secara normal, rumus adalah rumit dan memerlukan beberapa pembetulan. Tambahan pula, ketidak pincangan, dana kata ini, tidaklah selalu diinginkan.

Penganggar lain yang kadang-kala digunakan adlalah pernyataan yang serupa

 

Bentuk ini mempunyai ralat kuasa dua min yang seragam dan lebih kecil berbanding penganggar tidak pincang, dan mengganggar hampir maksimum apabila populasi ditaburkan secara normal.

Sisihan piawai bagi pemboleh ubah selanjarSunting

Taburan selanjar sering memberi rumus bagi mengira sisihan piawai sebagai fungsi parameter taburan. Secara umum, sisihan piawai bagi pemboleh ubah rawak selanjar X dengan fungsi ketumpatan kebarangkalian p(x) adalah

 

Iaitu

 

ContohSunting

Kita akan menunjukkan bagaimana mengira sisihan piawai bagi satu populasi. Contoh kita akan menggunakan umur empat kanak-kanak: { 5, 6, 8, 9 }.

Langkah 1. Kira min aritmetik,  :

 

Kita mempunyai N = 4 kerana terdapat empat titik data:

 
 
 
 
        Menggantikan N dengan 4
 
 
    Ini ialah min.

Langkah 2. Hitung sisihan piawai,  . (Memandangkan empat nilai mewakili keseluruhan populasi, kita tidak menggunakan rumus bagi anggaran sisihan piawai dalam kes ini):

 
        Mengganti N dengan 4
        Mengganti   dengan 7
 
 
 
 
 
 

Maka, sisihan piawai bagi umur empat kanak-kanak dalah punca kuasa 2.5, atau lebih kurang 1.58.

Jika set ini merupakan sampel yang diambil dari populasi besar kanak-kanak, dan soalan adalah untuk menganggar sisihan piawai populasi, konvensyen akan menggantikan pembawah N (or 4) dalam Langkah 2 dengan N−1 (or 3).

Tafsiran dan kegunaanSunting

Sisihan piawai yang besar menunjukkann titik data adalah jauh dari min dah sebaliknya. Sebagai contoh, setiap set data {0, 0, 14, 14}, {0, 6, 8, 14} dan {6, 6, 8, 8} mempunyai min 7. Sisihan piawainya ialah 7, 5, dan 1, masing-masing, Set ketiga mempunyai sisihan piawai terkecil kerana nilainya berhampiran dengan 7. Maka, sisihan piawai memberitahu kita betapa jauh titik data boleh berada. Ia turut mempunyai unit yang sama dengan data, Sebagai contoh, set data {0, 6, 8, 14} mewakili umur empat adik beradik dalam tahun, maka sisihan piawainya ialah 5 tahun.

Contoh lain, data set {1000, 1006, 1008, 1014} mungkin mewakili jarak yang dilalui oleh 4 orang atlet dalam 3 minit, dan diukur dalam meter. Minnya ialah 1007 meter, dan sisihan piawainya ialah 5 meter.

Sisihan piawai boleh digunakan sebagai pengukuran ralat. Dalam sains fizik contohnya, sisihan piawai yang dilaporkan bagi sekumpulan pengukuran berulang patut memberikan kepersisian pengukuran. Apabila ingin menentukan sama ada pengukuran bersetuju dengan ramalan teori, sisihan piawai bagi pengukuran tersebut adalah penting: jika min terlalu jauh dari ramalan, maka kita menganggap pengukuran bercanggah dengan ramalan. Hal ini adalah masuk akal kerana mereka telah berada di luar julat nilai yang patut.

Contoh sebenarSunting

CuacaSunting

Sebagai contoh mudah, kita mengambil kira suhu purata dua buah bandar. Sementara dua bandar mempunyai suhu purata 60 °F, adalah amat membantu untuk memahami julat bagi bandar berhampiran pantai lebih kecil berbanding di kawasan pedalamanm yang menunjukkan, sementara puratanya sama, perubahan adalah besar di kawasan pedalaman berbanding di pantai.

Maka, purata 60 berlaku pada satu bandar dengan suhu tinggi 80 °F dan rendah 40 °F, dan juga bagi bandar bersuhu tinggi 65 dan rendah 55. Sisihan piawai membolehkan kita mengenal pasti purata yang masa mempunyai perubahan yang besar, lalu mempunyai sisihan piawai yang besar.

Tafsiran geometriSunting

Untuk mendapatkan pandangan geometri, kita akan mula dengan sebuah populasi yang mempunyai tiga nilai, x1, x2, x3. Ini menakrifkan titik P = (x1, x2, x3) dalam R3. Katakan garis L = {(r, r, r) : r dalam R}. Ini adalah "pepenjuru utam" melalui titik asalan. Jika tiga nilai diberi semuanya sama, maka sisihan piawai adallah sifar dan P akan berada pada L. maka tidak mustahil untuk menganggap sisihan piawai berkaitan dengan jarak P kepadaL. Dan itulah kesnya. Bergerak secara ortogon dari P ke garis L, satu bersilang pada satu titik:

 

yang koordinatnya adalah min kepada nilai yang kita mulakan tadi. Sedikit algebra menunjukkan bahawa jarak antara P dan R (yang sama dengan jarak antara P dan garis L) diberi oleh σ√3. Rumus analogi (dengan 3 digantikan oleh N) juga sah untuk populasi bernilai N; kita kemudian perlu melalukan kerja untuk RN.

Peraturan bagi data bertaburan normalSunting

 
biru gelap adalah kurang satu sisihan piawai dari min. Bagi taburan norma, ini ialah 68.27 % set; sementara dua sisihan piawai dari min (biru gelap dan sederhana) meliputi 95.45 %; dan tiga sisihan piawai (biru gelap, sederhana dan cerah) meliputi 99.73 %.

Seseorang sering menganggap yang data adalah dari populasi yang agak bertaburan normal. Ini sering diwajarkan oleh teori had tengah klasik, yang mengatakan bahawa jumlah bagi pemboleh ubah rawak yang ditabur secara bebas dan sama akan cenderung kepada taburan normal sebagai had. Jika anggapan ini wajar, maka lebih kurang 68 % nilai dalam 1 sisihan piawai min, lebih kurang 95 % nilai dari dua sisihan piawai dan lebih kurang 99.7 % dari 3 sisihan piawai. Ini dikenali sebagai peraturan 68-95-99.7, atau peraturan empirik

sela keyakinan adalah seperti berikut:

σ 68.26894921371%
95.44997361036%
99.73002039367%
99.99366575163%
99.99994266969%
99.99999980268%
99.99999999974%

Bagi taburan normal, dua titik lengkungan iaitu satu sisihan piawai dari min adalah juga titik lengkok balas.

Ketaksamaan ChebyshevSunting

Ketaksamaan Chebyshev membuktikan bagi sebarang set data, hampir semua nilai berada hampir dengan nilai min, dengan maksud "hampir" itu adalah ditentukan oleh sisihan piawai. Ketaksamaan Chebyshev sesuai untuk (hampir) semua taburan rawak, buukan sahaja untuk normal, dan berikut merupakan kaitannya:

Sekurang-kurangnya 50% nilai adalah dalam 1.41 sisihan piawai dari min.
Sekurang-kurangnya 75% nilai adalah dalam 2 sisihan piawai dari min.
Sekurang-kurangnya 89% nilai adalah dalam 3 sisihan piawai dari min.
Sekurang-kurangnya 94% nilai adalah dalam 4 sisihan piawai dari min.
Sekurang-kurangnya 96% nilai adalah dalam 5 sisihan piawai dari min.
Sekurang-kurangnya 97% nilai adalah dalam 6 sisihan piawai dari min.
Sekurang-kurangnya 98% nilai adalah dalam 7 sisihan piawai dari min.

Dan secara amnya:

Sekurang-kurangnya (1 − 1/k2) × 100% nilai adalah dalam k sisihan piawai dari min.

Hubungan antara sisihan piawai dan minSunting

Min dan sisihan piawai bagi satu set data sering dilapotkan bersama. Dalam kes tertentu, sisihan piawai merupakan ukuran "semula jadi" bagi serakan statistik jika pusat data itu diukur pada min. Ini disebabkan sisihan piawai dari min adalah lebih kecil dari mana-mana titik. Pernyataan tepat adalah berikut: katakan x1, ..., xn dalah nombor nyata dan takrifkan fungsi:

 

menggunakan kalkulus, atau hanya penyelesaian kuasa dua, adalah mungkin untuk menunjukkan yang σ(r) mempunyai minimum unik pada min:

 

(Ini juga boleh dilakukan dengan hanya algebra, memandangkan σ2(r) disamakan dengan polinomial kuadratik).

Pekali perubahan bagi sampel adalah nisbah sisihan piawai kepada min. ia adlaah nombor tak berdimensi yang boleh digunakan untuk membandingkan varians antara populasi dengan min berbeza.

Kaedah pengiraan pantasSunting

Cara yang lebih cepat untuk mengira sisihan piawai adalah dengan rumus berikut (walaupun pertimbangan harus dibuat untuk syarat ralat pembundaran, limpahan aritmetik, dan limpah bawahnya):

 

atau

 

iaitu kuasa jumlah s0, s1, s2 ditakrifkan olehh

 

Serupa untuk sisihan piawai sampel:

 

atau bagi jumlah:

 

Lihat jugaSunting

Pautan luarSunting