logo
3 часть

10.2.2. Домашнее задание и методические указания по его выполнению

При выполнении домашнего задания студент должен ознакомиться с постановкой и методами решения задач оценки параметров распределения случайных величин и корреляционного анализа. Для этого необходимо воспользоваться литературой /1/.

Величина, которая в результате некоторого эксперимен­та с заранее непредсказуемым исходом каждый раз принимает одно из возможных значений, называется случайной.

Пусть исход эксперимента (опыта, наблюдения) представляет­ся некоторой случайной величиной y. При N-кратном повторении получают конкретный ряд значений y1, …, yN, кото­рый называется конечной выборкой объема N (выборочной сово­купностью) из генеральной совокупности, содержащей все воз­можные значения случайной величины y (N  ). На практике вид и параметры дифференциальной функ­ции распределения точно неизвестны и информация о характерис­тиках случайной величины может быть получена с помощью экс­перимента.

Для построения эмпирического графика распределения случай­ной величины у по результатам наблюдений в порядке их воз­растания формируется ряд распределения, который оформляется в виде таблицы, где перечислены и указаны границы j-х интер­валов возможных значений случайной величины y и соответствую­щих им вероятностей pj появления у в соответствующих j-x интер­валах.

Для каждого интервала (yj-1, yj) определяются число попавших в него элементов Nj, относительная частота j = Nj/N, и строится график N(y), который может быть представлен в виде либо гисто­граммы, либо полигона частот.

Коэффициент парной корреляции является показателем тесноты и направления корреляционной связи двух случайных перемен­ных, и его значение находится в пределах -1  Rxy +1. При отсутствии корреляционной связи между двумя случайными переменными коэффициент парной корреляции Rxy = 0, в этом случае корреляционная связь между переменными х и у отсутст­вует. Если связь между двумя переменными линейная и функциональная, тогда Rxy = +l или Rxy = -1.

Пример. Дана выборка значений выходного параметра yi (i=1,N) объемом N = 130: y1 = уmin = 8; у2 = 9,2; ...; уN = уmax = 54. Требуется построить эмпирическую плотность вероятности случайной величи­ны у.

Решение:

Определяем приближенное число интервалов К и округляем до ближайшего целого: K = 1,0 + 3,2lg130  8. Обычно K = 6÷12.

Ширину интервалов у выбираем одинаковой

у = (уmaxmin) / K = (54 - 8) / 8 = 5.75.

Принимаем у = 6. Находим среднее значение параметра у из выборки

.

Строим числовую ось у, на которой отмечаем среднее зна­чение у. От среднего значения у откладываем по обе стороны 0,5у, а затем — по целому интервалу у, пока крайние интервалы не перекроют уmах = 54 и уmin = 8.

По числовой оси определяем число Nj элементов выборки, попавших в интервал (yj-1, yj).

Рассчитываем относительную частоту j попадания в заданный j-й ин­тервал и значение уj* для каждого интервала:

уj* = (уj-1+ уj) / 2.

Все результаты записываем в таблицу. По данным таблицы строим эм­пирический график распределения у. Правильность расчетов следует проверять по условию:

, .

Так как в ряде случаев при исследовании конструкций и технологических процессов РЭА приходится прибегать к регрессионному анализу, одной из пред­посылок которого является распределение случайной величины по нормальному закону распределения, то, используя данные таблицы, проведем проверку гипо­тезы о гауссовском распределении случайной величины у. Для проверки гипотезы будем использовать 2-критерий Пирсона, значение которого вычисляется по формуле:

где- вероятность попадания выборочного значенияyj в интервал разбиения [уmaxj, yminj].

При этом следует иметь в виду, что при использовании 2-критерия необ­ходимо учитывать, что интервалы с числом элементов, меньшим 10, необходимо объединить с соседними (кроме внутренних). Общее число элементов должно быть N  50, число элементов, попавших в любой j-й интервал, Nj  5 (j = 1, К), общее число интервалов К*, оставшихся после объединения, должно удовле­творять условию К*  4.

После расчета ве­роятности попадания значений случайной величины у в каждый j-й интервал и вычисления вспомогательных данных Npj, (Nj - Npj), (Nj - Npj)2 получаем расчетное значение 2-критерия 0,11875. По таблице находим границу 2-критической области для заданного уровня значимости критерия q = 5 %, т.е. вероятности, для которой событие можно считать практически невозможны, и числа степеней свободы f = K* l — 1 = 6 — 2 — 1 = 3, где число оцениваемых параметров для данного закона распределения (дисперсия и математическое ожидание) l = 2. Так как 2pacч = 0,11875 < 2гр, то выборочный материал не противоречит гипотезе о гауссовском распределении случайной величины у.