Пример использования множественной линейной регрессии
Предположим, что необходимо дать среднестатистический прогноз путевого расхода топлива автомобиля. Для этого имеется возможность воспользоваться множественным регрессионным анализом (на основе анализа параметров большого числа автомобилей) для оценки расхода топлива Q [л/100 км], с использованием следующих переменных (параметров):
m1 – Объем двигателя автомобиля [см3]; m2 – Масса автомобиля [кГ]; m3 – Тип привода, определяемый числом ведущих колес [2 или 4]; m4 – Мощность двигателя [л.с.].
В этом примере предполагается, что существует линейная зависимость между каждой независимой переменной (m1, m2, m3 и m4) и зависимой переменной (Q), то есть расходом топлива. Исходные данные показаны на рисунке.
Настройки для решения поставленной задачи показаны на рисунке окна "Регрессия". Результаты расчетов размещены на отдельном листе в таблице 6.
В итоге получена следующая математическая модель:
Q = -0,002159246·x1 + 0,001581937·x2 + 1,987200675·x3 + 0,078512695·x4- 4,428016498
Теперь можно определить примерный расход топлива у легкового автомобиля с бензиновым двигателем и колесной формулой 4 × 4, если известно, что двигатель автомобиля имеет объем 2700 см3, его масса составляет 1950 кг, автомобиль имеет полный привод на колеса – 4 ведущих колеса, мощность двигателя составляет 163 л.с., используя следующую формулу:
Q = -0,002159246·2700 - 0,001581937·1950 + 1,987200675·4 + 0,078512695·163 - 4,428016498
Решив это уравнение, получаем расход топлива у данного автомобиля: Q = 13,57 л/100 км.
В регрессионном анализе наиболее важными результатами являются:
коэффициенты при переменных и Y-пересечение, являющиеся искомыми параметрами модели;
множественный коэффициент R, характеризующий точность
модели для имеющихся исходных данных;
F-критерий Фишера (в рассмотренном примере он значительно превосходит критическое значение, равное 3,54868E-09);
t-статистика – величины, характеризующие степень значимости отдельных коэффициентов модели.
На t-статистике следует остановиться особо. Очень часто при построении регрессионной модели неизвестно, влияет ли тот или иной фактор Х на Y. Включение в модель факторов, которые не влияют на выходную величину, ухудшает качество модели. Вычисление t-статистики помогает обнаружить такие факторы. Приближенную оценку можно сделать так: если при n>>k величина t-статистики по абсолютному значению существенно больше трех, соответствующий коэффициент следует считать значимым, а фактор включить в модель. В противном случае его необходимо исключить из модели. Таким образом, можно предложить технологию построения регрессионной модели, состоящую из двух этапов:
1) обработать пакетом "Регрессия" все имеющиеся данные, проанализировать значения t-статистики;
2) удалить из таблицы исходных данных столбцы с теми факторами, для которых коэффициенты незначимы, и обработать пакетом "Регрессия" новую таблицу.
Для примера рассмотрим переменную m4. В справочнике по математической статистике t-критическое с (n-k-1) = 15-5-1=9 степенями свободы и доверительной вероятностью 0,95 равно 2,26. Поскольку абсолютная величина t, равная 4,17 больше, чем 2,26, мощность двигателя - это важная переменная для оценки расхода топлива. Аналогичным образом можно протестировать все другие переменные на статистическую значимость. Ниже приводятся наблюдаемые t-значения для каждой из независимых переменных:
Объем двигателя | 1,6313587 |
Масса автомобиля | 1,2914363 |
Тип привода | 6,7238724 |
Мощность двигателя | 4,1752164 |
Из таблицы видно, что значения «Мощности двигателя – m4» и «Типа привода – m3» имеют абсолютную величину большую, чем 2,26 следовательно, эти переменные, использованные в уравнении регрессии, полезны для предсказания путевого расхода топлива автомобиля. А такие значения как «Масса автомобиля – m2» и «Объем двигателя – m1» имеют абсолютную величину меньшую чем 2,26. Следовательно, эти переменные, использованные в уравнении регрессии, необходимо исключить из модели. Это позволит повысить качество предсказания путевого расхода топлива автомобиля.
- Федеральное государственное бюджетное образовательное учреждение
- 1. Методологические основы научного познания и творчества
- Формулирование цели и постановка задач исследования
- 2. Теоретические и эмпирические методы исследования
- Методика планирования экспериментального исследования
- Тема 3. Изучаемые вопросы: Методика планирования экспериментального исследования; Цель планирования экспериментального исследования; Определение объема выборки методом проверки статистических гипотез.
- Оборудование для задания тестовых режимов
- Измерительные приборы и системы, используемые при проведении научных исследований
- Измерение сил с помощью тензорезисторного моста
- Тарировка тензометрических измерителей силовых параметров
- Измерение давления
- Измерение интервалов времени
- Измерение скорости вращения
- Измерение угла поворота вала
- Измерение температуры
- Термопреобразователи сопротивления
- Анализ температурных полей
- Гироскопический метод измерения углов
- Измерение расхода топлива расходомером поршневого типа
- Оборудование для визуализации результатов измерений
- Тема 6. Изучаемые вопросы: Принцип работы электронно-лучевого осциллографа; Калибровка электронно-лучевого осциллографа.
- Аналого-цифровое преобразование измеряемых сигналов
- Тема 7. Изучаемые вопросы: Числовой код и представление чисел в виде двоичного кода; Принцип аналого-цифрового преобразования.
- Метрологические характеристики аналого-цифрового преобразования
- Теория и методология научно-технического творчества
- Статистические характеристики
- Аналитические научные исследования на автомобильном транспорте
- Аппроксимация данных с использованием метода наименьших квадратов
- Построение трендовых моделей при помощи диаграмм
- Регрессионный анализ
- Тема 11. Изучаемые вопросы. Методика проведения регрессионного анализа; Построение модели множественной регрессии в среде mikrosoft excel.
- Пример использования множественной линейной регрессии
- Контрольные вопросы
- Список основной литературы:
- Список дополнительной литературы:
- Оглавление
- Основы научных исследований Учебно-методическое пособие
- Иркутский государственный технический университет
- 664074, Иркутск, ул. Лермонтова, 83