Бизнес статистика
Чрез прост случаен безвъзвратен подбор са извлечени 180 студенти-първокурсници от популация, в която попадат общо 3000 души. Тези 180 студенти са подложени на тест по статистика, за да се види как възприемат материала. Техните резултати са оценени по скала от 0 до 100 точки. Получени са следните данни, групирани със стъпка 5:
Интервал (точки) Честота (брой на студентите) f
1. Да се оцени средния резултат, показан от студентите чрез:
2. Да се оцени абсолютното и относително разсейване в резултатите.
3. Да се опише разпределението на резултатите, като се използват коефициентите на асиметрия и ексцес.
4. Да се определи 95%-ния доверителен интервал за средната аритметична на популацията.
5. Как ще се измени обемът на извадката, ако при фиксирано стандартно отклонение повишим точността на оценката два пъти?
6. Може ли да се приеме хипотезата, че средната на популацията, от която е извлечена извадката, е равна на 50 точки, ако е известно, че популационната дисперсия е 81 и предварително нивото на значимост е фиксирано на 5%.
Средната аритметична x- =fiXi/fi =8303/180=46,15
Изчисленията са показани в таблицата в колони 3 и 4, като в колона три са намерени средите на интервалите.
Модата Mo=LMO +(f0-f1)h/(f0-f1)(f0-f2)=45+(42-22)5/(42-22)(42-30)
=48,125. Модалния интервал е интервалът с най-много случаи в него, т.е. 45-49.
Медианата Me= LMe +[(fi+1)/2-CME-1]h/f=
Медианната група се определя като броя на единиците се раздели на две=90 и се види 90-тата единица в кой интервал е, а тя е в интервала 45-49.
Разсейването ще оценим чрез средноквадратичното отклонение (абсолютно разсейване) и неговият коефициент на вариация (относително разсейване).
= квадратен корен от (xi-x-)2.f/N=квадратен корен от 14661/180=
Изчисленията са показани в таблицата в колони 6 и 7.
Коефициентът на вариация V =.100/x- =8,6.100/46=19,35
Асиметрия: ще я изчислим чрез коефициент, свързан с третия момент на разпределението.
S3=[(xi-x-)3 /fi]/ 3=(197191/180)/8.93=1.55
Резултатите от изчисленията са показани в таблицата в колони 8 и 9.
Ексцесът също ще оценим чрез коефициент, свързан с момент на разпределението, но с четвъртия момент.
Е=[(xi-x-)4 /fi]/ 4=(3125801/180)/8.94=2.77.
Резултатите от изчисленията са показани в таблицата в колони 10 и 11.
Доверителният интервал за средната аритметична е
x-+-x- , където x- =(z/n-2)*(1-n/N)-2=
(1.96*8.9/sqrt180)*sqrt(1-180/3000)=1.26. В уравнението при 95% вероятност по таблица z=1,96.
Следователно действителната средна аритметична се намира в интервала от 44.89 до 47.41.
5. Как ще се промени обема на извадката, ако при фиксирано стандартно отклонение повишим точността на оценката два пъти: с други думи трябва да решим горното уравнение, в което обаче е известна и е 1.26/2=0.63, а n е неизвестно. След изчисления се получава, че n е 611.62, което е 612 човека.
6. Нулева хипотеза: средната на извадката е равна на средната са популацията.
Алтернативна хипотеза: двете средни са различни.
Равнище на значимост: 0.05.
Емпирична характеристика на хипотезата= средната на съвкупността минус средната на извадката делено на стандартното отклонение върху корен от обема на извадката, което е равно на 17.99. Теоретичната характеристика на хипотезата взимаме от таблицата и тя е равна на 1.96. Следователно приемаме алтернативната хипотеза, т.е. извадката е от друга популация.
Разполагаме със следните данни за 10 български домакинства, които случайно са извлечени от цялата популация на домакинствата в РБ.
№ Среден месечен доход Разход за културни
1. Съществува ли връзка между двете променливи Х и У?
2. Постройте линеен регресионен модел, в който зависимата променлива е У, а независимата е Х.
3. Проверете дали регресионния коефициент е статистически значим и интерпретирайте този коефициент.
4. Определете каква част от разсейването на У може да се обясни чрез разсейването на Х.
Линейния регресионен модел е Y=a+b.X
Коефициентите a и b се намират по формулите:
a=средната на Y минус b*средната на Х.
b=[(XY/n)-средната на Х по средната на Y]/ X2-средната на Х на квадрат.
Средната на Х=701, средната на Y=37.05.
След заместване се получава, че b=0.12
Следователно а=37-b*701= -53.37,
Регресионните коефициенти a и b имат следните значения:
а показва точката на пресичане на регресионната линия с ординатната ос.
b е тангенсът на ъгъла, който сключва регресионната линия с абсцисната ос. Това е показател, който характеризира промяната на Y при изменението на Х с единица.
Проверка за значимост на регресионния коефициент b:
Средната грешка се намира по формулата
=корен квадратен от [2/(x-x-)2], което е равно на 0.02. Изчисленията са показани в таблицата в колони 11, 12 и 13.
Алтернативна хипотеза: b"0.
Равнище на значимост: 0.05
Емпирична характеристика на хипотезата tem=b/=0.12/0.02=6.
Теоретична характеристика на хипотезата: от таблицата, при двустранна критична област и осем степени на свобода, е 2.31.
Следователно приемаме алтернативната хипотеза, т.е. че коефициентът е статистически значим.
Коефициентът на детерминация r2 показва каква част от разсейването на Y може да се обясни с разсейването на Х.
y~2=[(Y~-Y-)/n] =1220.9076
Следователно r2=0.76, което означава, че 76% от дисперсията на Y може да се обясни с дисперсията на Х.
Коефициентът на корелация r=0.87, което означава, че между двете променливи има умерена връзка.
Дадени са по години следните данни (в млн. долари) за продажбите на коли и камиони на General Motors за периода 1983-1992 години.
Година Продажби (млн. долари)
1. Да се определят темповете на растеж:
а) при постоянна база 1984=100%
2. Да се определят темповете на прираст:
а) за 1987 г. спрямо 1984 г.
б) за 1992 г. спрямо 1983 г.
3. Да се построи аналитичен модел на тренда по метода на най-малките квадрати за линеен и квадратичен тренд.
Да се построи диаграма на развитието - фактическо и изравнено.
а) с постоянна база 1984г.
за 1984 спрямо 1983=8.3/7.8=1.16
за 1985 спрямо 1984=9.3/8.3=1.12
за 1986 спрямо 1985=8.6/9.3=0.95
за 1987 спрямо 1986=7.8/8.6=0.91
за 1989 спрямо 1987=8.1/7.8=1.04
за 1990 спрямо 1989=7.9/8.1=0.98
за 1991 спрямо 1990=7.5/7.9=0.95
за 1992 спрямо 1991=7.0/7.5=0.93
а) за 1987 спрямо 1984=(7.8-8.3)/8.3=-0.06
б) за 1992 спрямо 1983=(7.0-7.8)/7.8=-0.1
3. Аналитичен модел на тренда по метода на най-малките квадрати
За линеен тренд уравнението има вида:
Ако преномерираме времето, така че t=0, задачата се решава по-лесно:
Следователно a=72.3/9=8.03
b=-0.15, т.е. Y=8.03-0.15*X
|
|