Сокращение сроков ввода в эксплуатацию изделий авиационной техники, малые объемы подвергаемых испытаниям элементов авиационных конструкций, образующиеся в результате этих факторов незавершенные выборочные совокупности наблюдений требуют разработки и внедрения соответствующих методов статистического анализа, учитывающих эти обстоятельства. Многократно цензурированные выборки [1, 2] образуются в результате определения наработки ответственных элементов конструкции, достигших или не достигших критического состояния к моменту технического осмотра. Случайно цензурированные выборки могут образовываться также при испытаниях на усталость материалов и элементов двигателей, агрегатов и планера летательных аппаратов, когда ряд объектов в связи с ограничением времени не достигают критического состояния и снимаются с испытаний. В этих условиях одной из проблем является оценка характеристик долговечности и ресурса авиационных конструкций. Известные методы оценивания, такие как метод максимального правдоподобия [1–4], приводят к сложным систе- мам нелинейных уравнений, решение которых зат- руднено из-за немонотонности целевых функций, наличия ряда локальных экстремумов и т.д.
В связи с этим в настоящей работе рассматривается задача моделирования и оценивания параметров незавершенных выборочных совокупностей методом наименьших квадратов (МНК), обладающим уникальными свойствами наиболее устойчивых и эффективных для малых выборок оценок с минимальной дисперсией.
В соответствии с МНК [3, 4] вектор оценок параметров линейной модели
y = X × b, (1)
где y – вектор-столбец наблюдений размерности n; X – матрица размерности n ´ k1 известных коэффициентов (n > k1); b – вектор-столбец параметров размерности k1, определяется из уравнения
. (2)
Матрица рассеяния оценок b определяется из уравнения
(3)
несмещенная оценка для остаточной дисперсии s2 определяется формулой
, (4)
где V – ковариационная матрица размерности n´n оценок параметров линейной модели.
Адекватность модели проверяется обычным способом на основании F-распределения дисперсионного отношения [3, 4].
Уравнения (3) и (4) позволяют оценивать параметры расположения (сдвига) и масштаба на основании порядковых статистик, то есть выборочных наблюдений, упорядоченных по величине. Пусть yi – порядковые статистики, a и s – параметры сдвига и масштаба (необязательно среднее и стандартное отклонения). В соответствии с МНК матрица X размерности n´2 имеет следующий вид:
, (5)
где a – вектор-столбец размерности n математических ожиданий порядковых статистик.
Оценки параметров сдвига и масштаба и их матрица рассеяния определяются по уравнениям (2) и (3), где V – ковариационная матрица размерности n´n нормированных порядковых статистик.
Элементы вектора математических ожиданий (a) и ковариационной матрицы (V) нормированных порядковых статистик [3, 4] определяются из следующих уравнений:
, (6)
, (7)
(8)
, (9)
где l, s =1, ..., n; f(z), F(z) – плотность и функция нормированного непрерывного распределения с параметрами сдвига и масштаба.
Для двухпараметрического логарифмически нормального y =lnx и нормального y=x распределений z=(y–a)/s.
Для представления трехпараметрического распределения Вейбулла–Гнеденко к виду с параметрами сдвига и масштаба осуществляют следующее нормирующее преобразование:
(10)
В случае трехпараметрических логарифмически нормального и распределения Вейбулла–Гнеденко y = ln(x – x0), где x0 – независимая оценка порогового значения случайной величины или x0 = 0.
Для однократно цензурированной справа выборки оценки параметров сдвига и масштаба и их ковариационная матрица определяются по тем же формулам, но при этом матрица X, вектор наблюдений y, ковариационная матрица V составляются по первым k наблюдениям случайной величины из n объектов, подвергшихся испытанию, а величина n в вышеприведенных формулах остается неизменной.
Интервальные оценки квантиля распределения для полной выборки из нормального или логарифмически нормального закона распределения (см. [5, 6]) определяются уравнениями:
, (11)
, (12)
где xpl, xpu – нижняя и верхняя доверительные границы для квантиля распределения xp уровня вероятности P; b – уровень доверительной вероятности (обычно b=0,9 или 0,95); tg[f, D] – квантиль уровня g нецентрального распределения Стьюдента с f = n – 1 степенями свободы и с параметром нецентральности ; zp – квантиль уровня P нормированного нормального распределения; – оценки параметров нормального распределения.
Точное значение квантиля нецентрального распределения Стьюдента t определяется по таблицам или в соответствии с разработанными вычислительными алгоритмами [6].
Для распределения Вейбулла–Гнеденко с параметрами сдвига и масштаба, а также в цензурированных выборках могут быть вычислены приближенные доверительные интервалы для квантилей распределения на основании нормальной аппроксимации. С этой целью предположим приближенно нормальным закон распределения случайной величины
с математическим ожиданием
(13)
и дисперсией
, (14)
где xp = a + zp × s – квантиль распределения. Элементы ковариационной матрицы (v) оценок параметров в соответствии с (3)
. (15)
, ,
. (16)
Вероятность b того, что P{j<0}, приводит к следующему приближенному уравнению:
, (17)
где zb – квантиль уровня b нормированного нормального распределения.
После преобразований определяется приближенное значение t, соответствующее числу степеней свободы f = n – 1, параметру нецентральности и доверительной вероятности b:
, (18)
,
, (19)
В формулах (19) учтены поправки на смещение оценок, имеющие место в полной выборке. По формуле (18) осуществляется аппроксимация нецентрального распределения Стьюдента для полной выборки, при этом
(20)
Доверительные границы для параметра сдвига a получают из (11) и (12) как частный случай при zp = 0, D = 0. Для нормального закона эти границы совпадают с доверительными границами для медианы распределения. В этом случае нецентральное распределение Стьюдента вырождается в хорошо табулированное центральное t-распределение Стьюдента. Для нормального распределения пара- метр нецентральности определяется по формуле (zp – квантиль нормированного нормального распределения). Для распределения Вейбулла–Гнеденко, представленного в виде распре- деления с параметрами сдвига и масштаба, как показано выше, параметр нецентральности определяется из уравнения , где .
Необходимо отметить, что точные доверительные границы (11), (12) для квантиля распределения случайной величины и их аппроксимации (19), (20) получены в предположении вариации параметров сдвига и масштаба. Однако, как отмечается в ра- ботах [7, 8], тогда эти границы могут оказаться неоправданно широкими при малых объемах наблюдений, свойственных испытаниям авиационных конструкций, что приводит к весьма заниженным оценкам гарантированного ресурса, нормируемого по нижней доверительной границе квантиля дол- говечности. В таком случае часто пренебрегают вариацией параметра масштаба , заменяя его априорным значением s, полученным по результатам большого числа предварительных испытаний (для конструкций планера, например, среднее квадратичное отклонение логарифма долговечности предполагается равным 0,15). В этом случае матрица X (5) представляет собой вектор из еди- ниц размерности n, а в уравнениях (19) следует положить равными нулю все элементы матрицы рассеяния, имеющие индексы 2,2 и 1,2: . Для полной выборки уравнение (20) примет следующий вид: .
Для применения рассмотренных выше математических моделей в случайно цензурированных выборках в настоящей работе предлагается формирование эквивалентной (квазиполной) выборки на базе исходной цензурированной путем бутстреп-моделирования случайных чисел в диапазоне, ограниченном наблюдаемыми порядковыми статистиками. С этой целью методом Монте-Карло моделировалась полная выборка (на основе нормального закона распределения и распределения Вейбулла–Гнеденко), в которой случайным образом путем моделирования равномерно распределенных случайных чисел в заданном диапазоне формировались объекты, не достигшие критического состояния. Доля таких объектов составляла от 0 до 50 % при объемах выборки 10, 12, 15 и 20. Цензурированные наблюдения заменялись далее случайно выбранными результатами наблюдений той же выборки, достигшими критического состояния. В дальнейшем выборка сортируется и формируется эквивалентная квазиполная выборка, параметры которой могут быть определены как обычным не- параметрическим методом:
(21)
так и рассмотренным выше МНК, имеющим лучшие показатели эффективности.
Для проверки предлагаемой модели прово- дилось статистическое моделирование с многократным (до 2 000 раз) повторением испытаний, в каждом из которых оценивались параметры эквивалентных выборок по уравнению (2) и доверительная вероятность накрытия границами (11), (12) квантилей распределения. Для определения математических ожиданий и ковариаций порядковых статистик использовалась авторская вычислительная программа, основанная на разложении в ряд Корниша–Фишера. Расчетная двусторонняя доверительная вероятность b составляла 0,9. Уровень квантиля распределения P задавался 0,01. Эти результаты сравнивались с оценками, полученными для полной выборки. Результаты расчетов по- казали хорошее соответствие результатов для па- раметров сдвига и масштаба в пределах 1–2 % относительных погрешностей. Несколько большая погрешность (до 5 % с ростом степени цензурирования) наблюдалась в оценке доверительных вероятностей для квантилей распределения. Некоторые результаты моделирования, иллюстрирующие эти данные, представлены в таблице 1 для объемов испытаний 10 и 20. Расчеты проводились также для распределения Вейбулла–Гнеденко с близкими по точности результатами. Сравнение с непараметрическими оценками (21) показало незначительное отличие в точечных оценках параметров, но существенно меньшую дисперсию оценок для МНК, как и следовало ожидать.
Аналогичный вычислительный алгоритм может быть применен для задачи оценивания параметров реальной случайно цензурированной выборки, его блок-схема показана на рисунке 1. Отметим, что при моделировании случайных чисел в диапазоне порядковых статистик предполагается, что моделируемое наблюдение не может быть меньше соответствующего цензурированного значения. С этой целью в блок-схеме предусмотрен цикл возврата при невыполнении данного условия. Программы расчета параметров случайно цензурированных выборок на языке Javascript существуют в открытом доступе на сайте http://inteh.mpei.ru.
Пример 1. В таблице 2 представлены результаты усталостных испытаний на изгиб 20 лопаток из титанового сплава компрессора низкого давления авиационного двигателя при симметричном цикле амплитуды переменных напряжений. Звездочками обозначены значения логарифмов долговечностей лопаток, не достигших критического состояния к моменту снятия с испытаний. Произвести оценку параметров нормального распределения логарифма долговечности и вычислить приближенные 90 %-ные доверительные границы для квантиля уровня P=0,01.
В таблице 3 представлена та же выборка, но обработанная с помощью бутстреп-моделирования цензурированных элементов в соответствии с алгоритмом, представленным на рисунке 1.
Оценки параметров нормального закона распределения логарифма долговечности , вычислялись методом наименьших квадратов по уравнению (2), оценки дисперсий параметров – по уравнению (3), доверительные границы , – по формулам (11), (12) с учетом (18), (19). Оценка квантиля уровня 0,01 определялась по формуле . Результаты расчетов представлены в таблице 4.
Функция распределения логарифма долговечности представлена на рисунке 2 на нормальной вероятностной бумаге. Там же отмечены опытные значения по таблице 3.
На основании изложенного сделаем следующие выводы.
В работе рассмотрена методика точечного и интервального оценивания параметров распределений, применяемых при статистическом анализе усталостных испытаний элементов авиационных конструкций на базе метода наименьших квадратов, учитывающая наличие цензурированных наблюдений.
С целью адаптации методики для случайно цензурированных выборок разработаны модель и алгоритм моделирования порядковых статистик, которые позволяют получить эквивалентную (квазиполную) выборку.
Для проверки методики проводились статистическое моделирование методом Монте-Карло на основе нормального закона распределения и распределения Вейбулла–Гнеденко и бутстреп-моделирование в условиях случайного цензурирования, показавшее относительную погрешность в оценке параметров сдвига и масштаба в пределах 1–2 % и около 5 % в оценке доверительных вероятностей для квантилей распределения, что позволяет рекомендовать полученные решения для дальнейшего исследования и практического применения.
Литература
1. Cohen А.С. Progressively censored sampling in the three parameter log-normal distribution. Technometrics, 1976, vol. 18, no. 1, pp. 99–103.
2. Соhen А.С. Multi-censored sampling in the three para- meter weibull distribution. Technometrics, 1975, vol. 17, no. 3, pp. 347–350.
3. Кендалл М.Дж., Стьюарт А. Теория распределений. М.: Наука, 1966. 588 с.
4. Кендалл М.Дж., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973, 899 с.
5. Агамиров Л.В. Методы статистического анализа механических испытаний. М.: Интермет Инжиниринг, 2004. 128 с.
6. Агамиров Л.В., Агамиров В.Л., Вестяк В.А. Метод расчета квантилей распределения характеристик усталостных свойств элементов конструкций // Вестн. МАИ. 2011. Т. 18. № 4. С. 71–76.
7. Райхер В.Л. Рассеяние усталостной долговечности. М.: ЛАТМЭС, 2003. 224 с.
8. Райхер В.Л. Усталостная повреждаемость. М.: ЛАТМЭС, 2006. 238 с.