Névjegyek

Megbízhatóság valószínűsége 95. A kvantitatív elemzés módszerei: A megbízhatósági intervallumok becslése. Tesztelje a fizetett megoldások képességeit

Megbízhatósági intervallum - a statisztikai mennyiség határértékei, amelyek adott γ konfidencia valószínűséggel nagyobb mintával ebben az intervallumban lesznek. A jelölés P (θ - ε. A gyakorlatban a γ konfidencia valószínűségét az γ = 0,9, γ = 0,95, γ = 0,99 értékek közül választjuk ki, amelyek kellően közel vannak az egységhez.

Szolgáltatás célja... Ez a szolgáltatás meghatározza:

  • konfidencia intervallum az általános átlaghoz, konfidencia intervallum a varianciához;
  • a szórás konfidencia intervalluma, az általános frakció konfidencia intervalluma;
A kapott megoldás Word fájlba kerül. Az alábbiakban egy videó utasítás található a kezdeti adatok kitöltéséről.

1. példa. A kolhozban az összesen 1000 fejből álló juhállományból 100 juh szelektív kontrollnyíráson esett át. Ennek eredményeképpen juhonként átlagosan 4,2 kg gyapjúnyírást állapítottak meg. Határozza meg 0,99 valószínűséggel a minta négyzetes középső hibáját az egy juhra eső gyapjú átlagos nyírásának meghatározásakor és a nyírási érték határértékeinek meghatározásakor, ha a szórás 2,5. A minta nem ismétlődik.
2. példa. A Moszkvai Északi Vámhivatalnál egy behozott termékből 20 tétel mintát vettek véletlenszerű, ismételt mintavétellel. Az ellenőrzés eredményeként megállapították a mintában az "A" termék átlagos nedvességtartalmát, amely 6% -nak bizonyult 1% -os szórással.
Határozza meg 0,683 valószínűséggel a termék átlagos nedvességtartalmának határait az importált termékek teljes tételében.
3. példa. Egy 36 tanuló felmérése azt mutatta, hogy átlagosan hány tankönyvet olvastak el tanév, kiderült, hogy egyenlő 6. Ha feltételezzük, hogy a hallgató félévenként elolvasott tankönyveinek normál eloszlási törvénye van, a szórás 6, akkor találjuk meg: A) 0,99 -es megbízhatósággal intervallumbecslést a matematikai elvárásokra ennek a véletlen változónak; B) mennyire valószínű az az állítás, hogy a hallgató által félévenként olvasott tankönyvek átlagos száma, amelyet erre a mintára számítottak, abszolút értékben legfeljebb 2-vel tér el a matematikai elvárástól.

Megbízhatósági intervallum osztályozása

Az értékelt paraméter típusa szerint:

Mintatípus szerint:

  1. A végtelen minta megbízhatósági intervalluma;
  2. A végső minta megbízhatósági időköze;
A mintavételt újramintavételnek nevezik. ha a kiválasztott objektumot visszaadják a sokaságnak a következő kiválasztása előtt. A mintát nem ismétlődőnek nevezik ha a kiválasztott objektum nem kerül vissza az általános populációba. A gyakorlatban az ember általában nem ismétlődő mintákkal foglalkozik.

Az átlagos mintavételi hiba kiszámítása véletlenszerű mintavétel esetén

A mintából kapott mutatók értékei és az általános populáció megfelelő paraméterei közötti eltérést nevezzük a reprezentativitás hibája.
Az általános és a mintapopuláció fő paramétereinek megnevezése.
Átlagos mintavételi hiba képletek
újraválasztásnem ismétlődő kiválasztás
középremegosztásraközépremegosztásra
A mintavételi hibahatár (Δ) közötti arány bizonyos valószínűséggel garantált P (t),és az átlagos mintavételi hiba formája: vagy Δ = t μ, ahol t- a megbízhatósági együttható, amelyet a P (t) valószínűségi szinttől függően határoznak meg a Laplace integrálfüggvény táblázata szerint.

Képlet a minta méretének kiszámítására megfelelő véletlenszerű kiválasztási módszerrel

Kiválasztási módszerMinta méret képletek
középremegosztásra
Megismételt
Megismételhetetlen
A minta méretét számológép segítségével találhatja meg.

Megbízhatósági intervallum módszer

A megbízhatósági intervallum megtalálásának algoritmusa a következő lépéseket tartalmazza:
  1. a γ (megbízhatóság) bizalmi valószínűség van beállítva.
  2. a mintával meghatározzuk az a paraméter becslését.
  3. a konfidencia intervallumot (a - ε; a + ε) a P (α 1) összefüggésből számítjuk ki.

1. példa. Egy tabletta (250 db) alkalmasságának ellenőrzésekor kiderült, hogy egy tabletta átlagos tömege 0,3 g, a súly szórása pedig 0,01 g. Keresse meg azt a megbízhatósági intervallumot, amelyben a a tabletta súlya 90% -os valószínűséggel csökken.
Megoldás.

Egy példa. A minta megfigyeléséből (B minta) számítsa ki a populáció átlagának, varianciájának és szórásának elfogulatlan becsléseit.
Töltse le a megoldást

Egy példa. Keresse meg a konfidencia intervallumokat a populációk átlagának és szórásának becsléséhez y konfidenciaszint mellett, ha B és y mintát veszünk a populációkból.
Töltse le a megoldást

Egy példa.

1. A 2. feladatban elvégzett számítások eredményeit felhasználva, és feltételezve, hogy ezeket az adatokat véletlenszerű, 10 százalékos, megismételhetetlen kiválasztás segítségével szerezték be, határozza meg:
a) azokat a határokat, amelyeken túl 0,954 -es megbízhatósági szint mellett nem megy át a jellemző átlagértéke a lakosságra számítva;
b) hogyan lehet megváltoztatni a minta méretét annak érdekében, hogy az átlag határhibáját 50%-kal csökkentsük.
2. A 2. feladatban elvégzett számítások eredményeinek felhasználásával és feltételezve, hogy ezeket az adatokat ismételt mintavételezéssel nyerték, határozza meg:
a) azokat a határokat, amelyeken túl azon vállalatok részesedésének értéke, amelyekben az attribútum egyedi értékei meghaladják a divatot 0,954 -es bizalmi szint mellett, nem lépi túl az általános népességben;
b) hogyan lehet megváltoztatni a minta méretét annak érdekében, hogy 20%-kal csökkentsék a marginális frakció hibáját.
Módszertani utasítások

A feladat... Az azonos típusú alkatrészek gyártására szolgáló gyártósort rekonstruálták, két mintát állítanak be, amelyek tükrözik a törmelék százalékos arányát az ezen a vonalon gyártott alkatrészek tételeiben a rekonstrukció előtt és után.

Egy példa. Az alábbiakban az oroszországi nyugat -szibériai olajbázis 49 kútjának fúrási költségeire (c.u.) vonatkozó adatok találhatók:

129 142 132 61 96 96 142 17 135 32
77 58 37 132 79 15 145 64 83 120
11 54 48 100 43 25 67 25 140 130
48 124 29 107 135 101 93 147 112 121
89 97 60 84 46 139 43 145 29
Az új kút fúrásának költségeinek becsléséhez:
  1. mintát készíteni megfelelő véletlenszerű módon n = 5 térfogattal;
  2. határozza meg az általános populáció átlagának (X) intervallumértékeit a számított mintaindikátorok (X, s 2) alapján, a Student t-eloszlás függvényének használatával az α = 0,05 szignifikancia szinten;
  3. a kezdeti adatok alapján határozza meg az általános népesség átlagának (X) pontértékét;
  4. értékelje az intervallumszámítások helyességét az (X) pontérték és a mintából kiszámított intervallumérték összehasonlításával;
Megoldás ezt a számológép segítségével hajtjuk végre:

1. Válasszon 5 értéket a táblázatból. Legyen ez a 3. oszlop: 132, 37, 48, 29, 60.
Fejezetben "A statisztikai sorozat nézete" válasszon egy diszkrét sorozatot. A Sorok száma mezőben adja meg az 5 értéket.

2. Írja be a kezdeti adatokat.

A Csoportok száma mezőben válassza ki a " ne csoportosuljon».

Az „Általános átlag, szórás és szórás konfidencia intervalluma” mezőben adja meg a γ = 0,95 értéket (ami α = 0,05).

A „Minta” mezőben adja meg a 10 értéket (mivel 49 értékből 5 lett kiválasztva, ami 10,2% -nak felel meg (5 / 49x100%)).

Fejezetben "Jelentendő kimenetek" megjelöljük az első tételt "Bizalmi intervallum az általános átlaghoz".

3. A kapott megoldás Word formátumban kerül mentésre (letöltés).
A számítások előtt egy előzetes táblázat jön létre, amelyben az X érték ismétléseinek száma megszámlálásra kerül.

x(x - x átlag) 2
29 1036.84
37 585.64
48 174.24
60 1.44
132 5012.64
306 6810.8
Ebben az esetben minden X érték pontosan egyszer fordul elő. Az általános népesség átlagának intervallumértékeit a " Az általános népesség középpontjának intervallumbecslése ".
jegyzet: ebben az esetben a számítások használják A szórás becslése.

2. feladat: Annak érdekében, hogy tanulmányozzuk az üzem dolgozói által az egyik alkatrész gyártására fordított időt, 10% -os véletlenszerű, nem ismétlődő mintavételt végeztek, amelynek eredményeként az alkatrészek idő szerinti megoszlását megkapták, a mellékletben . B.
Ezen adatok alapján számítsa ki:
a) egy alkatrész gyártására fordított átlagos idő;
b) az eltérések (szórás) és a szórás átlagos négyzete;
c) variációs együttható;
d) 0,954 valószínűséggel a mintaátlag határhibája és azok a lehetséges határok, amelyekben az egy alkatrész gyártására fordított átlagos idő várható az üzemben;
e) 0,954 valószínűséggel a mintavételi arány és a határ határhibája fajsúly az alkatrészek száma, amelyek minimális gyártási idővel rendelkeznek. A számítások elvégzése előtt fel kell írni a probléma feltételeit, és ki kell tölteni a táblázatot. 2.1

Megoldás.
A megoldás eléréséhez a következő paramétereket kell megadnunk:

  • Statisztikai sorozat típusa: Diszkrét sorozat van beállítva;
  • Csoportok száma: ne csoportosítson;
  • Az általános átlag, a variancia és a szórás konfidenciaintervallumának összeállításához: y = 0,954;
  • Az általános részesedés konfidencia intervallumának felépítése: y = 0,954;
  • Minta: 10;
  • Jelentés: Bizalmi intervallum az általános átlaghoz, Megbízhatósági intervallum az általános részesedéshez;

3. feladat: A 2. feladatban elvégzett számítások eredményeit felhasználva, és feltételezve, hogy ezeket az adatokat ismételt mintavétel segítségével szerezték be, határozza meg:

b) hogyan lehet megváltoztatni a minta méretét annak érdekében, hogy az arány marginális hibája 20%-kal csökkenjen.

Megoldás.
A 2. feladatban elvégzett számítások eredményeit felhasználva, és feltételezve, hogy ezeket az adatokat ismételt mintavételezéssel szerezték be, határozza meg:
a) azok a határok, amelyeken túl azon vállalatok részesedésének értéke, amelyekben a tulajdonság egyedi értékei meghaladják az általános népesség módját, 0,954 -es bizalmi szint mellett nem lépnek túl;
b) hogyan lehet megváltoztatni a minta méretét annak érdekében, hogy 20%-kal csökkentsék a marginális frakció hibáját.

4. feladat: Egy 20% -os véletlenszerű, nem ismétlődő mintát vettünk egy izzókból, hogy meghatározzuk a tekercs átlagos súlyát. A mintavételi eredmények a következők. Tömeg, mg: 38-40; 40-42; 42-44; 44-46. Spirálok száma: 15; 30; 45; 10. Határozza meg 0,95 valószínűséggel a megbízhatósági határokat, amelyekben a tekercs átlagos súlya található a teljes izzótételre.

Megoldás.
Adja meg a következő paramétereket:

  • Statisztikai sorozat típusa: Egy intervallumsorozat van megadva;
  • Az általános átlag, a szórás és a szórás konfidencia -intervallumának felépítése: y = 0,95;
  • Minta: 20;
  • Jelentés: Bizalmi intervallum az általános átlaghoz.

5. feladat: Az elektromos lámpák gyárában egy tétel termékből 16.000 db mennyiségben. 1600 db mintára vett lámpák. (véletlenszerű, nem megismételhető kiválasztás), ebből 40 db. hibásnak bizonyult. Határozza meg 0,997 valószínűséggel, hogy az elutasítások hány százaléka lesz a teljes termékcsoportban.

Megoldás.
Itt N = 16000, n = 1600, w = d / n = 40/1600 = 0,025.

Annak a valószínűségét hívjuk meg, hogy a mért mennyiség valódi értéke egy bizonyos intervallumon belülre esik bizalmi szint , vagy biztonsági tényező, és maga az intervallum - megbízhatósági intervallum.

Minden megbízhatósági szintnek megvan a maga megbízhatósági intervalluma. Különösen a 0,67 -es konfidencia intervallum felel meg a tól -ig terjedő konfidencia intervallumnak. Ez az állítás azonban csak kellően sok (több mint 10) mérésre érvényes, és a 0,67 valószínűsége nem tűnik elég megbízhatónak - a három méréssorozat mindegyikében y a bizalmi intervallumon kívül lehet. Kapni több önbizalom az a tény, hogy a mért mennyiség értéke a konfidencia intervallumon belül helyezkedik el, általában 0,95 - 0,99 konfidencia valószínűséggel. Megbízhatósági intervallum egy adott megbízhatósági valószínűséghez, figyelembe véve a mérések számának hatását n a számtani átlag szórásának megszorzásával találhatjuk meg

.

az úgynevezett Student-együtthatóval. A diákok együtthatói számos értékre és n táblázatban vannak megadva.

Táblázat - Hallgatói együtthatók

Mérések száma n A bizalom valószínűsége y
0,67 0,90 0,95 0,99
2,0 6,3 12,7 63,7
1,3 2,4 3,2 5,8
1,2 2,1 2,8 4,6
1,2 2,0 2,6 4,0
1,1 1,8 2,3 3,3
1,0 1,7 2,0 2,6

Végül a mért mennyiséghez y adott bizalmi szinten y és a mérések száma n a feltételt elérik

Felhívjuk a mennyiséget véletlen hiba nagyságrendek y.

Példa: lásd az 5. előadást - számsorozat.

Mi határozzuk meg

A mérések számával - 45 és a megbízhatósági szinttel - 0,95 azt kapjuk, hogy a Hallgatói együttható megközelítőleg 2,15. Ekkor a megbízhatósági intervallum ennek a méréssorozatnak 62,6.

Hiányzik (durva hiba) - súlyos hibák, amelyek kezelői hibákkal járnak, vagy nem számolnak be külső hatásokkal. Általában ki vannak zárva a mérési eredményekből. A hiányzásokat általában a figyelmetlenség okozza. Előfordulhatnak a készülék meghibásodása miatt is.

A bizalmi intervallumok becslése

Tanulási célok

A statisztika a következőket veszi figyelembe két fő feladat:

    Van néhány becslésünk a mintaadatok alapján, és valószínűségi állítást szeretnénk tenni arról, hogy hol van a becsült paraméter valódi értéke.

    Van egy konkrét hipotézisünk, amelyet tesztelni kell a mintaadatok alapján.

Ebben a témában az első feladatot vesszük figyelembe. Bemutatjuk a konfidencia intervallum definícióját is.

A megbízhatósági intervallum egy olyan intervallum, amely a becsült paraméterérték köré épül, és azt mutatja, hogy a becsült paraméter valódi értéke hol található a priori adott valószínűséggel.

A téma anyagának tanulmányozása után Ön:

    megtudja, mi a becslés konfidencia intervalluma;

    megtanulni statisztikai feladatokat osztályozni;

    elsajátítani a konfidencia intervallumok felépítésének technikáját, mind statisztikai képletek szerint, mind szoftvereszközök használatával;

    megtanulják, hogyan kell meghatározni a szükséges mintaméreteket a statisztikai becslések pontosságának bizonyos paramétereinek eléréséhez.

A minta jellemzőinek megoszlása

T-eloszlás

Amint azt fentebb tárgyaltuk, a véletlen változó eloszlása ​​közel áll a szabványos normál eloszláshoz a 0 és 1 paraméterekkel. Mivel nem ismerjük a σ értékét, néhány s becsléssel helyettesítjük. A mennyiségnek már más eloszlása ​​van, mégpedig, ill A diák t eloszlása, amelyet az n -1 paraméter (a szabadságfokok száma) határoz meg. Ez az eloszlás közel áll a normál eloszláshoz (minél nagyobb az n, annál közelebb vannak az eloszlások).

Ábrán. 95
a Hallgató 30 szabadságfokú eloszlását mutatjuk be. Mint látható, nagyon közel van a normál eloszláshoz.

A normál eloszlású NORMDIST és NORMINV funkciókhoz hasonlóan vannak funkciók a t -eloszlással való munkavégzéshez - TDIST és TINV... Ezekre a funkciókra egy példa található a TDIST.XLS fájlban (sablon és megoldás) és az ábrán. 96
.

Egyéb jellemzők megoszlása

Mint már tudjuk, a matematikai elvárás becslésének pontosságának meghatározásához szükségünk van a t-eloszlásra. Más paraméterek, például variancia becsléséhez különböző eloszlásokra van szükség. Kettő közülük az F-eloszlás és x 2 -eloszlás.

Megbízhatósági intervallum az átlaghoz

Megbízhatósági intervallum egy intervallum, amely a becsült paraméterérték köré épül, és megmutatja, hogy a becsült paraméter valódi értéke hol található a priori adott valószínűséggel.

Megáll az átlag konfidencia intervallumának felépítése a következő módon:

Példa

A gyorsétterem egy új típusú szendvicssel tervezi bővíteni választékát. A kereslet felmérése érdekében a menedzser azt tervezi, hogy véletlenszerűen kiválaszt 40 látogatót azok közül, akik már kipróbálták, és felkéri őket, hogy 1 -től 10 -ig értékeljék az új termékhez való hozzáállásukat. pontokat kapnak Új termékés hozzon létre 95% -os megbízhatósági intervallumot ehhez a becsléshez. Hogyan lehet ezt megtenni? (lásd a SANDWICH1.XLS fájlt (sablon és megoldás).

Megoldás

A probléma megoldásához használhatja. Az eredményeket az ábra mutatja. 97
.

Megbízhatósági időköz az összesített értékhez

Néha a mintaadatok alapján nem a matematikai elvárást, hanem az értékek teljes összegét kell megbecsülni. Például egy könyvvizsgálóval kapcsolatos helyzetben nem lehet érdekes egy számla átlagos értékének becslése, hanem az összes számla összege.

Legyen N teljes összeg elemek, n ​​a minta mérete, T 3 a minta értékeinek összege, T "a becslés az összegre a teljes populációban, majd , és a konfidencia intervallumot a képlet számítja ki, ahol s a minta szórásának becslése, a minta átlagának becslése.

Példa

Tegyük fel, hogy néhány adóhivatal meg akarja becsülni a 10.000 adófizető teljes adó -visszatérítését. Az adózó vagy visszatérítést kap, vagy további adót fizet. Keresse meg a visszatérítési összeg 95% -os megbízhatósági intervallumát, ha a minta mérete 500 fő (lásd: RETURNS SUM.XLS (sablon és megoldás).

Megoldás

A StatPro -ban nincs speciális eljárás erre az esetre, azonban látható, hogy a határokat a fenti képletek alapján az átlag határértékeiből lehet megkapni (98. ábra)
).

Megbízhatósági intervallum az arányhoz

Legyen p az ügyfelek részarányának matematikai elvárása, és p ennek a részaránynak az n méretű mintából kapott becslésében. Kimutatható, hogy kellően nagy a becslés eloszlása ​​közel lesz a normál értékhez p átlaggal és szórással ... Ebben az esetben a becslés standard hibáját úgy fejezzük ki , és a bizalmi intervallum, mint .

Példa

A gyorsétterem új típusú szendvicsekkel tervezi bővíteni választékát. A kereslet felmérése érdekében a menedzser véletlenszerűen kiválasztott 40 látogatót azok közül, akik már kipróbálták, és felkérte őket, hogy 1 -től 10 -ig értékeljék az új termékhez való hozzáállásukat. akik legalább 6 pontnál értékelik az új terméket (elvárja, hogy ezek az ügyfelek legyenek az új termék fogyasztói).

Megoldás

Kezdetben egy új oszlopot hozunk létre 1 alapján, ha az ügyfél pontszáma meghaladta a 6 pontot, és egyébként 0 (lásd a SANDWICH2.XLS fájlt (sablon és megoldás).

1. módszer

Az 1 -es számot számolva becsüljük meg a részesedést, majd a képleteket használjuk.

A z cr érték a normál eloszlás speciális tábláiból származik (például 1,96 a 95% -os konfidencia intervallumhoz).

Ezt a megközelítést és specifikus adatokat használva a 95% -os intervallum felépítéséhez a következő eredményeket kapjuk (99. ábra)
). A z cr paraméter kritikus értéke 1,96. A becslés standard hibája 0,077. A megbízhatósági intervallum alsó határa 0,475. A megbízhatósági intervallum felső határa 0,775. Így a menedzsernek jogában áll 95% -os magabiztossággal feltételezni, hogy azoknak az ügyfeleknek a százalékos aránya, akik 6 vagy több pontra értékelték az új terméket, 47,5 és 77,5 között lesz.

2. módszer

Ez a feladat a szokásos StatPro eszközökkel megoldható. Ehhez elég megjegyezni, hogy a részesedés ebben az esetben egybeesik a Típus oszlop átlagos értékével. Ezután jelentkezzünk StatPro / Statisztikai következtetés / Egymintás elemzés az átlag (a várható érték becslése) konfidencia -intervallumának felépítéséhez a Típus oszlophoz. Az ebben az esetben kapott eredmény nagyon közel lesz az 1. módszer eredményéhez (99. ábra).

Megbízhatósági időköz a szóráshoz

A szórás becslésére az s értéket használjuk (a képletet az 1. szakasz tartalmazza). Az s becslés sűrűségfüggvénye a chi-négyzet függvény, amely a t-eloszláshoz hasonlóan n-1 szabadságfokú. Ezzel a CHIDIST és CHIINV disztribúcióval speciális funkciók használhatók.

A bizalmi intervallum ebben az esetben már nem lesz szimmetrikus. A határok sematikus diagramja az ábrán látható. 100.

Példa

A gépnek 10 cm átmérőjű alkatrészeket kell gyártania, de különböző körülmények miatt hibák fordulnak elő. A minőségellenőr két dolog miatt aggódik: először is az átlagnak 10 cm -nek kell lennie; másodszor, még ebben az esetben is, ha az eltérések nagyok, sok rész elutasításra kerül. Minden nap 50 részből álló mintát készít (lásd a QUALITY CONTROL.XLS fájlt (sablon és megoldás). Milyen következtetéseket vonhat le egy ilyen minta?

Megoldás

Ábrázolja a 95% -os megbízhatósági intervallumokat az átlag és a szórás segítségével StatPro / Statisztikai következtetés / Egymintás elemzés(101. ábra
).

Továbbá az átmérők normális eloszlásának feltételezésével kiszámítjuk a hibás termékek arányát, és 0,065 -ös maximális eltérést állítunk be. A helyettesítési táblázat képességeinek felhasználásával (két paraméter esete) megalkotjuk a házasság arányának függését az átlagértéktől és a szórástól (102. ábra)
).

A két átlag közötti különbség bizalmi intervalluma

Ez az egyik legfontosabb alkalmazás statisztikai módszerek... Példák helyzetekre.

    Egy ruházati üzlet vezetője szeretné tudni, hogy egy átlagos vásárló mennyit költ többé -kevésbé egy üzletben, mint egy férfi.

    A két légitársaság hasonló útvonalakon repül. A fogyasztói szervezet szeretné összehasonlítani a két légitársaság átlagos várható késései közötti különbséget.

    A társaság kuponokat küld bizonyos fajtákárukat az egyik városban, és nem küldik be a másikba. A menedzserek összehasonlítani szeretnék ezeknek a tételeknek az átlagos vásárlási mennyiségét a következő két hónapban.

    Az autókereskedő gyakran foglalkozik házaspárokkal a bemutatókon. A párokat gyakran külön kérdezik meg, hogy megértsék a prezentációra adott személyes reakcióikat. A menedzser fel szeretné mérni a férfiak és nők által közölt minősítések közötti különbséget.

Független minta tok

Az átlagok közötti különbség t -eloszlású lesz n 1 + n 2 - 2 szabadságfok mellett. A μ 1 - μ 2 konfidencia intervallumot az alábbi arány adja meg:

Ez a feladat nemcsak a fenti képletekkel, hanem a szokásos StatPro eszközökkel is megoldható. Ehhez elegendő a jelentkezés

Megbízhatósági intervallum az arányok közötti különbséghez

Legyen a részvények matematikai elvárása. Legyenek a mintabecsléseik az n 1 és n 2 méretű mintákból. Ezután a különbség becslése. Ezért ennek a különbségnek a megbízhatósági intervalluma a következő:

Itt z cr a normál eloszlásból kapott érték, speciális táblázatok szerint (például 1,96 a 95% -os konfidencia intervallumhoz).

A becslés standard hibáját ebben az esetben az arány fejezi ki:

.

Példa

Az üzlet a nagy akcióra készülve a következőket vállalta marketing kutatás... A legjobb 300 vásárlót kiválasztották és véletlenszerűen két, egyenként 150 tagú csoportra osztották. Az összes kiválasztott vásárlónak meghívót küldtek az eladásban való részvételre, de csak az első csoport tagjaihoz csatolták az 5% -os kedvezményre jogosító kupont. Az eladás során mind a 300 kiválasztott vevő vásárlását rögzítették. Hogyan tudja a menedzser értelmezni az eredményeket és következtetni a kuponszállítás hatékonyságára? (lásd a COUPONS.XLS fájlt (sablon és megoldás)).

Megoldás

A mi esetünkben a 150 vásárló közül, akik kedvezményes kupont kaptak, 55 vásárolt egy akcióban, és 150 közül, aki nem kapott kupont, csak 35 vásárolt (103. ábra)
). Ekkor a mintaarányok értékei 0,3667 és 0,2333. És a mintakülönbség közöttük 0,1333, ill. Feltételezve, hogy a konfidencia intervallum 95%, a normál eloszlási táblázatból z cr = 1,96 -ot találunk. A mintavételi különbség standard hibájának kiszámítása 0,0524. Végül azt kapjuk, hogy a 95% -os megbízhatósági intervallum alsó határa 0,0307, ​​a felső határ pedig 0,2359. Az eredmények úgy értelmezhetők, hogy minden 100 vásárlóra, aki kedvezményes kupont kap, 3-23 új vásárlóra számíthat. Mindazonáltal szem előtt kell tartani, hogy ez a következtetés önmagában még nem jelenti a kuponok felhasználásának hatékonyságát (hiszen a kedvezmény biztosításával nyereséget veszítünk!). Mutassuk be ezt konkrét adatokkal. Tegyük fel, hogy az átlagos vásárlási méret 400 rubel, ebből 50 rubel. nyereség van a boltban. Ekkor a várható nyereség 100 vásárlóra vetítve, akik nem kapták meg a kupont:

50 0,2333 100 = 1166,50 rubel.

Hasonló számítások a kupont megkapó 100 vásárló esetében:

30 0,3667 100 = 1100,10 rubel.

Az átlagos nyereség 30 -ra való csökkenése annak köszönhető, hogy a kedvezmény igénybevételével a kupont megkapó ügyfelek átlagosan 380 rubel áron vásárolnak.

Így a végső következtetés arról szól, hogy az ilyen kuponok ebben a helyzetben nem hatékonyak.

Megjegyzés. Ez a feladat a szokásos StatPro eszközökkel megoldható. Ehhez elegendő ezt a problémát arra a problémára redukálni, hogy két módszerrel meg kell becsülni a módszert, majd alkalmazni kell StatPro / Statisztikai következtetés / Kétmintás elemzés hogy a két átlagérték közötti különbséghez megbízhatósági intervallumot építsünk.

A megbízhatósági intervallum hosszának szabályozása

A bizalmi intervallum hossza attól függ a következő feltételeket:

    közvetlen adatok (szórás);

    szignifikancia szint;

    minta nagysága.

Minta mérete az átlag becsléséhez

Először is, nézze meg a problémát általános esetben. Jelöljük B -nek a bizalmi intervallum hossza felének értékét B -ként (104. ábra)
). Tudjuk, hogy valamilyen X véletlen változó átlagértékének konfidenciaintervallumát fejezzük ki , ahol ... Feltételezve:

és kifejezve n, azt kapjuk.

Sajnos nem ismerjük az X véletlen változó varianciájának pontos értékét. Ezenkívül nem ismerjük a t cr értékét, mivel ez n-től függ a szabadságfokok számán keresztül. Ebben a helyzetben a következőképpen járhatunk el. Az s variancia helyett a szórás becslését használjuk a vizsgált véletlen változó bármely rendelkezésre álló megvalósítása alapján. A t cr érték helyett a z cr értéket használjuk a normál eloszláshoz. Ez teljesen elfogadható, mivel a normál és a t-eloszlás sűrűségfüggvényei nagyon közel vannak (kivéve a kis n esetet). Így a keresett képlet a következő formában jelenik meg:

.

Mivel a képlet általánosságban elmondható, hogy nem egész számokat eredményez, a kívánt minta méretét az eredmény kerekítési feleslegének kell tekinteni.

Példa

A gyorsétterem egy új típusú szendvicssel tervezi bővíteni választékát. A kereslet felmérése érdekében a menedzser azt tervezi, hogy véletlenszerűen kiválaszt bizonyos számú látogatót azok közül, akik már kipróbálták, és felkéri őket, hogy értékeljék az új termékhez való hozzáállásukat 1 -től 10 -ig. a várható pontok számát, amit az új kap. Ugyanakkor azt akarja, hogy a konfidencia intervallum fele ne haladja meg a 0,3 -at. Hány látogatót kell megkérdeznie?

alábbiak szerint:

Itt r sc a p tört becslése, B pedig a konfidencia intervallum hosszának adott fele. Az n használatával túlbecsült értéket kaphatunk az érték használatával r sc= 0,5. Ebben az esetben a konfidencia intervallum hossza nem haladja meg a B adott értékét a p valódi értéke esetén.

Példa

Hagyja, hogy az előző példából származó menedzser megtervezze az új típusú termékeket preferáló vásárlók arányát. 90% -os megbízhatósági intervallumot szeretne kiépíteni, amelynek fele nem haladhatja meg a 0,05 -öt. Hány ügyfelet kell bevonni a véletlenszerű mintába?

Megoldás

Esetünkben z cr értéke = 1,645. Ezért a szükséges összeget úgy számítják ki .

Ha a menedzsernek oka lenne azt hinni, hogy a p kívánt értéke például körülbelül 0,3, akkor ezt az értéket a fenti képletbe behelyettesítve a véletlen minta kisebb értékét kapjuk, mégpedig 228 -at.

Képlet a meghatározáshoz véletlenszerű mintaméretek két átlag közötti különbség eseténígy írva:

.

Példa

Néhány számítástechnikai cégügyfélszolgálati központja van. Az utóbbi időben megnőtt az ügyfelek panasza a rossz szolgáltatásminőség miatt. A szolgáltató központban főként kétféle alkalmazottat foglalkoztatnak: azokat, akik nem rendelkeznek nagy tapasztalattal, de speciális felkészítő tanfolyamokat végeztek, és széles körű gyakorlati tapasztalatokkal rendelkeznek, de nem végeztek speciális tanfolyamokat. A vállalat elemezni kívánja az elmúlt hat hónapban bekövetkezett vásárlói panaszokat, és összehasonlítja az átlagos létszámukat a két munkavállalói csoportra vonatkozóan. Feltételezzük, hogy a mintákban szereplő mennyiségek mindkét csoport esetében azonosak lesznek. Hány alkalmazottat kell bevonni a mintába, hogy 95% -os intervallumot kapjon, legfeljebb 2 -es félhosszal?

Megoldás

Itt a σ оц mindkét véletlen változó szórásának becslése, feltételezve, hogy közel vannak. Így feladatunk során valahogy meg kell szereznünk ezt a becslést. Ezt például az alábbiak szerint tehetjük meg. Miután megvizsgálta az ügyfelek panaszainak adatait az elmúlt hat hónapban, a menedzser észreveheti, hogy minden alkalmazott esetében főként 6-36 panasz van. Tudva, hogy normál eloszlás esetén szinte minden értéket legfeljebb három szórással távolítanak el az átlagból, ésszerűen azt hiheti, hogy:

, ahonnan σ оц = 5.

Ezt az értéket a képletbe behelyettesítve kapjuk .

Képlet a meghatározáshoz a véletlen minta mérete a részvények közötti különbség becslése eseténúgy néz ki, mint a:

Példa

Egy vállalatnak két gyára van, amelyek hasonló termékeket gyártanak. Egy cégvezető összehasonlítani szeretné a hibás termékek arányát mindkét gyárban. A rendelkezésre álló információk szerint a selejt aránya mindkét gyárban 3 és 5% között van. 99% -os megbízhatósági intervallumot kell felépítenie, a fele pedig legfeljebb 0,005 (vagy 0,5%). Hány elemet kell venni minden gyárból?

Megoldás

Itt a p 1 és a p 2 pont két ismeretlen hulladékarány becslése az 1. és a 2. gyárban. Ha p 1 pontot = p 2 pont = 0,5 -t teszünk, akkor n -re túlbecsült értéket kapunk. De mivel esetünkben rendelkezünk néhány a priori információval ezekről a részvényekről, ezeknek a részvényeknek a felső becslését vesszük, nevezetesen 0,05 -öt. Kapunk

Amikor a populáció egyes paramétereit a mintaadatok alapján becsüljük meg, akkor hasznos megadni a paraméternek nemcsak egy pontbecslését, hanem megadni a konfidencia intervallumot is, amely megmutatja, hogy hol lehet a becsült paraméter pontos értéke.

Ebben a fejezetben megismerkedtünk azokkal a mennyiségi arányokkal is, amelyek lehetővé teszik számunkra, hogy különböző intervallumokra ilyen intervallumokat készítsünk; megtanulta, hogyan lehet szabályozni a konfidencia intervallum hosszát.

Vegye figyelembe azt is, hogy a minta becslésének problémája (a kísérlet megtervezésének problémája) megoldható a szabványos StatPro eszközökkel, nevezetesen StatPro / Statisztikai közlemény / Minta méretének kiválasztása.

Ebben a cikkben megtudhatja:

    Mit megbízhatósági intervallum?

    Mi a lényege 3 szigma szabály?

    Hogyan lehet ezeket az ismereteket a gyakorlatban alkalmazni?

Napjainkban az áruk nagy választékához, az értékesítési területekhez, az alkalmazottakhoz, a tevékenységi területekhez stb. Kapcsolódó információk túlzott mennyisége miatt nehéz lehet kiemelni a főbbet, amire mindenekelőtt érdemes odafigyelni és erőfeszítéseket tenni a kezelése érdekében. Meghatározás megbízhatósági intervallumés a tényleges értékek határain túllépésének elemzése- ez a technika segít kiemelni a helyzeteket, befolyásolja a trendek változását. Képes lesz pozitív tényezők kifejlesztésére és a negatív tényezők hatásának csökkentésére. Ez a technológia számos ismert világcégnél használják.

Vannak ún. riasztások ", melyik tájékoztatja a menedzsereket hogy a következő érték egy bizonyos irányba mutat túllépett megbízhatósági intervallum... Mit is jelent ez? Ez annak a jele, hogy valamilyen nem szabványos esemény történt, ami esetleg megváltoztatja a meglévő tendenciát ebben az irányban. Ez a jel a tényre kitalálni a helyzetben, és megérteni, mi befolyásolta.

Gondoljunk például néhány helyzetre. Az értékesítési előrejelzést 100 termékre vonatkozó előrejelzési határokkal számoltuk 2011 -re hónapokra és a tényleges eladásokra márciusban:

  1. A "napraforgóolaj" esetében áttörték az előrejelzés felső határát, és nem estek a bizalmi intervallumba.
  2. A "száraz élesztő" esetében túlléptek az előrejelzés alsó határán.
  3. A "Zabpehely zabkásán" a felső határ megtört.

A többi áru esetében a tényleges értékesítés a megadott előrejelzési határokon belül volt. Azok. értékesítésük megfelelt a várakozásoknak. Tehát három olyan terméket azonosítottunk, amelyek túlléptek a határokon, és elkezdtük kitalálni, mi befolyásolta a határokon túli lépéseket:

  1. A "Napraforgóolaj" -hoz újat írtunk kereskedési hálózat, ami további értékesítéseket eredményezett számunkra, ami a felső határ átlépéséhez vezetett. Ennél a terméknél érdemes újra kiszámítani az előrejelzést az év végéig, figyelembe véve az e hálózatra történő értékesítés előrejelzését.
  2. Ami a "száraz élesztőt" illeti, az autó elakadt a vámnál, és 5 napon belül hiány volt, ami befolyásolta az eladások csökkenését és az alsó határon túllépést. Érdemes lehet kitalálni, hogy mi volt az oka, és megpróbálni nem megismételni ezt a helyzetet.
  3. A Zabpehely zabkása számára értékesítési promóciós eseményt indítottak, amely jelentősen megnövelte az eladásokat, és az előrejelzésen túllépéshez vezetett.

Három olyan tényezőt azonosítottunk, amelyek befolyásolták az előrejelzési határok túllépését. Az életben sokkal több lehet belőlük. Az előrejelzés és a tervezés pontosságának javítása érdekében, azok a tényezők, amelyek ahhoz vezetnek, hogy a tényleges értékesítés túlmutathat az előrejelzés határain, érdemes kiemelni és külön -külön elkészíteni az előrejelzéseket és terveket. . És akkor fontolja meg ezek hatását a fő értékesítési előrejelzésre. Ezen tényezők hatását rendszeresen fel is mérheti, és javíthatja a helyzetet a negatív és a pozitív tényezők hatásának csökkentésével.

A bizalmi intervallummal a következőket tehetjük:

  1. Jelölje ki az irányokat, amelyekre érdemes odafigyelni, tk. ilyen irányú események történtek, amelyek befolyásolhatják trendváltozás.
  2. Határozza meg a tényezőket amelyek valóban befolyásolják a helyzet változását.
  3. Elfogadni kiegyensúlyozott döntés(például beszerzésről, tervezésről stb.).

Most nézzük meg, mi a megbízhatósági intervallum, és hogyan kell kiszámítani Excelben egy példa segítségével.

Mi az a bizalmi intervallum?

A konfidencia intervallum az előrejelzési határok (felső és alsó), amelyeken belül adott valószínűséggel (szigma) a tényleges értékek szerepelnek.

Azok. kiszámítjuk az előrejelzést - ez a fő referenciapontunk, de megértjük, hogy a tényleges értékek nem valószínű, hogy 100% -ban megegyeznek előrejelzésünkkel. És felmerül a kérdés, milyen határokba a tényleges értékek szerepelhetnek, ha a jelenlegi tendencia folytatódik? És ez a kérdés segít válaszolni nekünk konfidencia intervallum kiszámítása, azaz - az előrejelzés felső és alsó határa.

Mi a Sigma cél valószínűsége?

Számításkor bizalmi intervallumot állítsa be a valószínűséget ütés tényleges értékeket a megadott előrejelzési határokon belül... Hogyan kell csinálni? Ehhez megadjuk a szigma értékét, és ha a sigma egyenlő:

    3 szigma- akkor annak valószínűsége, hogy a következő tényleges érték a bizalmi intervallumba esik, 99,7%, vagy 300: 1 lesz, vagy 0,3% valószínűséggel lépi túl a határokat.

    2 szigma- akkor annak valószínűsége, hogy a következő értéket a határokon belül eléri ≈ 95,5%, azaz az esély nagyjából 20: 1, vagy 4,5% esély van arra, hogy kilépjen a határokból.

    1 szigma- akkor a valószínűsége ≈ 68,3%, azaz az esély körülbelül 2: 1, vagy 31,7% az esély arra, hogy a következő érték a bizalmi intervallumon kívül esik.

Megfogalmaztuk 3 szigma szabály,amely ezt mondja találat valószínűsége következő véletlen érték a bizalmi intervallumban adott értékkel A három szigma 99,7%.

A nagy orosz matematikus, Chebyshev bebizonyította azt a tételt, hogy egy adott három szigma értékkel 10% valószínűséggel lépik túl az előrejelzési határokat. Azok. a 3 szigma bizalmi intervallumba esés valószínűsége legalább 90%lesz, míg az előrejelzés és határainak "szemmel" történő kiszámítására tett kísérlet sokkal jelentősebb hibákkal van tele.

Hogyan lehet önállóan kiszámítani a megbízhatósági intervallumot Excelben?

Vegyük fontolóra az Excel konfidencia-intervallumának kiszámítását (vagyis az előrejelzés felső és alsó határait) egy példával. Van idősorunk - az eladások hónapok alatt, több mint 5 év alatt. Lásd a csatolt fájlt.

Az előrejelzés határainak kiszámításához kiszámítjuk:

  1. Eladási előrejelzés().
  2. Sigma - szórás előrejelzési modellek a tényleges értékekből.
  3. Három szigma.
  4. Megbízhatósági intervallum.

1. Értékesítési előrejelzés.

= (RC [-14] (adatok idősorokban)- RC [-1] (modell érték)) ^ 2 (négyzet)


3. Összefoglaljuk minden hónapra a 8. szakasz Sum ((Xi-Ximod) ^ 2) eltéréseinek értékeit, azaz január, február összefoglalása ... minden évre.

Ehhez használja a = SUMIF () képletet

SUMIF (tömb a cikluson belüli periódusok számával (1-12 hónapig); hivatkozás a ciklus időszakának számára; hivatkozás a tömbre az eredeti adatok és az értékek közötti négyzetekkel Időszakokból)


4. Számítsuk ki a szórást az 1 -től 12 -ig tartó ciklus minden egyes periódusához (10. szakasz) a csatolt fájlban).

Ehhez a 9. szakaszban kiszámított értékből kivonjuk a gyökeret, és elosztjuk a ciklus periódusainak számával mínusz 1 = ROOT ((Összeg (Xi-Ximod) ^ 2 / (n-1))

Használjunk képleteket az Excel = ROOT (R8 (hivatkozás a (Sum (Xi-Ximod) ^ 2)/ (COUNTIF ($ O $ 8: $ O $ 67 (hivatkozás a ciklusszámokkal rendelkező tömbre); O8 (hivatkozás egy adott ciklusszámra, amelyet a tömb számol be))-1))

Excel képlet használata = COUNTIF megszámoljuk az n számot


Az előrejelzési modellből kiszámítva a tényleges adatok szórását, megkaptuk a szigma értéket minden hónapra - 10. szakasz a csatolt fájlban.

3. Számítsunk ki 3 szigmát.

A 11. szakaszban beállítottuk a szigmák számát - példánkban "3" (11. szakasz) a csatolt fájlban):

A gyakorlati szigmaértékek a következők:

1,64 szigma - 10% esély a túllépésre (10 -ből 1 esély);

1,96 szigma - 5% esély a határokon való kilépésre (1 esély 20 -ból);

2,6 szigma - 1% esély a határokon való kilépésre (1 esély 100 -ból).

5) Három szigma kiszámítása, ehhez minden hónap "szigma" értékeit megszorozzuk "3" -al.

3. Határozza meg a konfidencia intervallumot.

  1. Az előrejelzés felső határa- értékesítési előrejelzés, figyelembe véve a növekedést és a szezonalitást + (plusz) 3 szigma;
  2. Az előrejelzés alsó határa- értékesítési előrejelzés, figyelembe véve a növekedést és a szezonalitást - (mínusz) 3 szigma;

A hosszú távú megbízhatósági intervallum kiszámítása érdekében (lásd a mellékelt fájlt) az Excel képletet fogjuk használni = Y8 + VLOOKUP (W8; $ U $ 8: $ V $ 19; 2; 0), ahol

Y8- eladási előrejelzés;

W8- annak a hónapnak a száma, amelyre a 3 szigma értékét vesszük;

Azok. Az előrejelzés felső határa= "Értékesítési előrejelzés" + "3 szigma" (a példában VLOOKUP (hónapszám; táblázat 3 szigmaértékkel; oszlop, amelyből kivonjuk a megfelelő sor hónapszámával megegyező szigmaértéket; 0)).

Az előrejelzés alsó határa= "Értékesítési előrejelzés" mínusz "3 szigma".

Tehát kiszámítottuk a megbízhatósági intervallumot az Excelben.

Most van egy előrejelzésünk és egy határokkal rendelkező tartományunk, amelyen belül a tényleges értékek esnek egy adott sigma valószínűséggel.

Ebben a cikkben megvizsgáltuk, hogy mi a szigma és a három szigma szabály, hogyan lehet meghatározni a konfidencia intervallumot, és miért használhatja ezt a technikát a gyakorlatban.

Pontos előrejelzések és siker!

Hogyan A Forecast4AC PRO segíthet Önneka konfidencia intervallum kiszámításakor?:

    A Forecast4AC PRO automatikusan kiszámítja az előrejelzés felső vagy alsó határát egyidejűleg több mint 1000 idősorra;

    Az előrejelzés határainak a grafikonon belüli előrejelzéshez, trendhez és tényleges eladáshoz képest történő elemzésének képessége egyetlen gombnyomással;

A Forcast4AC PRO program képes 1 és 3 közötti szigma érték beállítására.

Csatlakozz hozzánk!

Töltsön le ingyenes előrejelző és üzleti elemző alkalmazásokat:


  • Novo Forecast Lite- automatikus előrejelzési számítás ban ben Excel.
  • 4analytics - ABC-XYZ elemzésés a kibocsátások elemzése Excel.
  • Qlik Sense Asztal és QlikViewPersonal Edition - BI rendszerek adatelemzéshez és vizualizációhoz.

Tesztelje a fizetett megoldások képességeit:

  • Novo Forecast PRO- előrejelzés Excelben nagy adathalmazokhoz.
Utolsó frissítés: 2020. március 3
Példa fájl

Konstruáljunk MS EXCEL -ben egy konfidencia intervallumot, hogy megbecsüljük az eloszlás átlagértékét egy ismert varianciaérték esetén.

Természetesen a választás bizalom szintje teljesen függ a megoldandó problémától. Így a légi utasnak a repülőgép megbízhatóságába vetett bizalmának kétségtelenül magasabbnak kell lennie, mint a vevőnek az izzó megbízhatóságába vetett bizalmának.

A probléma megállapítása

Tegyük fel, hogy ettől az általános lakosság miután elvette minta n méret. Feltételezik, hogy szórás ez az eloszlás ismert. Ez alapján szükséges mintavételértékelni az ismeretlent átlagos eloszlást(μ,) és konstruálja a megfelelőt kétoldalasmegbízhatósági intervallum .

Pontbecslés

Mint ismert, statisztika(jelöljük X Sze) egy az átlag elfogulatlan becslése ez az általános lakosságés eloszlása ​​N (μ; σ 2 / n).

jegyzet : Mi a teendő, ha építeni kell megbízhatósági intervallum elosztás esetén azt nemNormál? Ebben az esetben jön a mentő, amely azt mondja, hogy kellően nagy méretben mintavétel n az elosztásból nem lévénNormál , statisztika mintaeloszlása ​​X av lesz hozzávetőlegesen, körülbelül leveleznek normális eloszlás paraméterekkel N (μ; σ 2 / n).

Így, pontbecslésközépsőeloszlási értékek van - ez minta átlag, azaz X Sze... Most térjünk le a megbízhatósági intervallum.

Megbízhatósági intervallum ábrázolása

Általában az eloszlás és paramétereinek ismeretében kiszámíthatjuk annak valószínűségét, hogy a véletlen változó értéket vesz fel az általunk megadott intervallumból. Most tegyük az ellenkezőjét: keressük meg azt az intervallumot, amelybe a valószínűségi változó adott valószínűséggel esik. Például a tulajdonságokból normális eloszlás köztudott, hogy 95%-os valószínűséggel egy véletlen változó oszlik meg normális törvény, körülbelül +/- 2 tartományba esik középérték(lásd a cikket). Ez az intervallum prototípusként szolgál számunkra megbízhatósági intervallum .

Most nézzük meg, ismerjük -e az eloszlást , kiszámítani ezt az intervallumot? A kérdés megválaszolásához meg kell adnunk az eloszlás alakját és paramétereit.

Ismerjük az elosztási formát - az normális eloszlás(emlékezz erre jön O mintaeloszlásstatisztikaX Sze).

Nem ismerjük a μ paramétert (csak becsléssel kell használni megbízhatósági intervallum), de megvan a becslése X szerda, alapján számítják ki mintavétel, amelyeket fel lehet használni.

A második paraméter az a minta átlagának szórásaismertnek fogjuk tekinteni, ez egyenlő σ / √n.

Mert nem ismerjük μ-t, akkor a +/- 2 intervallumot fogjuk felépíteni szórások nem onnan középérték, és ismert becsléséből X Sze... Azok. számításakor megbízhatósági intervallum ezt NEM feltételezzük X Sze+/- 2 tartományba esik szórásokμ-ből 95%valószínűséggel, és feltételezzük, hogy a +/- 2 intervallum szórások tól től X Sze 95% valószínűséggel μ -t takar - a lakosság átlaga, ahonnan azt veszik minta... Ez a két állítás egyenértékű, de a második állítás lehetővé teszi számunkra a konstrukciót megbízhatósági intervallum .

Ezenkívül pontosítsuk az intervallumot: egy véletlen változó elosztva normális törvény, 95% valószínűséggel a +/- 1,960 intervallumba esik standard eltérések, nem +/- 2 szórások... Ezt a képlet segítségével lehet kiszámítani = NORM.ST.OBR ((1 + 0,95) / 2), cm. példa fájl Sheet Spacing .

Most megfogalmazhatunk egy valószínűségi állítást, amely a kialakításunkat szolgálja megbízhatósági intervallum: „Annak valószínűsége lakosság átlaga től átlagos minta 1 960 "-on belül a minta átlagos szórása " 95% ".

A nyilatkozatban említett valószínűségi értéknek különleges neve van amihez társulα (alfa) szignifikanciaszint egyszerű kifejezéssel bizalmi szint = 1 . A mi esetünkben szignifikancia szint α =1-0,95=0,05 .

Ezen valószínűségi állítás alapján most leírást írunk a számításhoz megbízhatósági intervallum :

ahol Z α / 2 alapértelmezettnormális eloszlás(a véletlen változó ilyen értéke z , mit P (z >= Z α / 2 ) = α / 2).

jegyzet : Felső α / 2-kvantilis határozza meg a szélességet megbízhatósági intervallum ban ben szórásokminta átlag. Felső α / 2-kvantilis alapértelmezettnormális eloszlás mindig nagyobb, mint 0, ami nagyon kényelmes.

Esetünkben α = 0,05, felső α / 2-kvantilis 1,960. Más szignifikanciaszintek esetén α (10%; 1%) felső α / 2-kvantilisZ α / 2 képlet segítségével lehet kiszámítani = STANDARD ST.OBR (1-α / 2) vagy ha ismert bizalmi szint , = NORM.ST.OBR ((1 + bizalmi szint) / 2) .

Általában építéskor konfidencia intervallumok az átlag becsléséhez csak használni felső α /2- kvantilisés ne használja alacsonyabb α /2- kvantilis... Ez azért lehetséges, mert alapértelmezettnormális eloszlás szimmetrikusan az x tengely körül ( eloszlási sűrűsége tekintetében szimmetrikus átlagos, azaz 0) . Ezért nincs szükség számításra alsó α / 2-kvantilis(egyszerűen α -nak hívják / 2-kvantilis), mert ez egyenlő felső α /2- kvantilis mínusz előjellel.

Emlékezzünk vissza, hogy az x mennyiség eloszlásának formája ellenére a megfelelő véletlen változó X Sze megosztott hozzávetőlegesen, körülbelülbírság N (μ; σ 2 / n) (lásd a cikket). Ezért általános esetben a fenti kifejezés a megbízhatósági intervallum csak hozzávetőleges. Ha az x mennyiséget elosztjuk normális törvény N (μ; σ 2 / n), majd a kifejezés megbízhatósági intervallum pontos.

Megbízhatósági intervallum számítása MS EXCEL -ben

Oldjuk meg a problémát. Az elektronikus komponens válaszideje a bemeneti jelre a készülék fontos jellemzője. A mérnök 95% -os megbízhatósági szinten szeretne megbízhatósági intervallumot ábrázolni az átlagos válaszidőre. A mérnök korábbi tapasztalataiból tudja, hogy a válaszidő szórása 8 ms. Ismeretes, hogy a mérnök 25 mérést végzett a válaszidő becslésére, az átlagos érték 78 ms volt.

Megoldás: A mérnök tudni akarja a válaszidőt elektronikai eszköz, de megérti, hogy a válaszidő nem fix, hanem véletlenszerű változó, amelynek saját eloszlása ​​van. Tehát a legjobban számíthat az eloszlás paramétereinek és alakjának meghatározására.

Sajnos a problémajelentésből nem tudjuk a válaszidő -eloszlás formáját (nem kell annak lennie Normál). , ez az eloszlás is ismeretlen. Csak neki ismert szórásσ = 8. Ezért, bár nem tudjuk kiszámítani a valószínűségeket és építeni megbízhatósági intervallum .

Azonban annak ellenére, hogy nem ismerjük az eloszlást időkülön válasz, tudjuk, hogy szerint CPT , mintaeloszlásátlagos válaszidő kb Normál(feltételezzük, hogy a feltételek CPT azért hajtják végre, mert a méret mintavétel elég nagy (n = 25)) .

Ráadásul, átlagos ennek az eloszlásnak az átlagos egyetlen válasz eloszlása, azaz μ. DE szórás ennek az eloszlásnak (σ / √n) a = 8 / ROOT (25) képletével lehet kiszámítani.

Az is ismert, hogy a mérnök kapott pontbecslésμ értéke 78 msec (X vö.). Ezért most kiszámíthatjuk a valószínűségeket, hiszen ismerjük az elosztási formát ( Normál) és paraméterei (X cf és σ / √n).

A mérnök tudni akarja várható értékμ a válaszidő -eloszlásból. Amint fentebb említettük, ez a μ egyenlő az átlagos válaszidő mintaeloszlásának matematikai várakozása... Ha használjuk normális eloszlás N (X cf; σ / √n), akkor a kívánt μ a +/- 2 * σ / √n tartományban lesz, körülbelül 95%-os valószínűséggel.

Jelentőségi szint 1-0,95 = 0,05.

Végül keresse meg a bal és jobb határt megbízhatósági intervallum... Bal szegély: = 78-STANDARD ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 74,864 Jobb szegély: = 78 + NORM.ST.OBR (1-0.05 / 2) * 8 / ROOT (25) = 81.136

Bal szegély: = NORM.OBR (0,05 / 2; 78; 8 / ROOT (25)) Jobb szegély: = NORM.INV (1-0.05 / 2; 78; 8 / ROOT (25))

Válasz : megbízhatósági intervallum nál nél konfidenciaszint 95% és σ =8 Kisasszony egyenlő 78 +/- 3,136 ms.

BAN BEN példa fájl a Sigma munkalapon számítási és építési űrlap ismert kétoldalúmegbízhatósági intervallumönkényes mintákat adott σ -val és szignifikancia szintje .

CONFIDENCE.NORM () függvény

Ha az értékeket mintavétel tartományban vannak B20: B79 , de szignifikancia szint 0,05; akkor az MS EXCEL képlet: = ÁTLAG (B20: B79) -TRUST.NORM (0,05, σ, COUNT (B20: B79)) visszaadja a bal oldali határt megbízhatósági intervallum .

Ugyanez a határ kiszámítható a következő képlet segítségével: = ÁTLAG (B20: B79) -NORM.ST.INV (1-0.05 / 2) * σ / ROOT (COUNT (B20: B79))

jegyzet: A CONFIDENCE.NORM () függvény megjelent az MS EXCEL 2010 -ben. Az MS EXCEL korábbi verzióiban a CONFIDENCE () függvényt használták.

Tetszett a cikk? Oszd meg