Новая Парадигма для Объяснимой Диагностики Неисправностей:
Random Forest, Поддерживаемый Термодинамическим Моделированием (TSRF)
Thermodynamic Simulation-assisted Random Forest: Towards explainable fault diagnosis of combustion chamber components of marine diesel engines, Measurement, 2025.
Введение
В области диагностики неисправностей камеры сгорания дизельных двигателей инженеры долгое время сталкиваются с тремя критическими проблемами:
- Нехватка Данных: Редкость реальных образцов отказов ограничивает эффективность обучения моделей глубокого обучения.
- Разрыв Реализации: Чистые физические модели часто требуют слишком больших вычислительных ресурсов для приложений инженерной автоматизации в реальном времени.
- Дилемма "Черного Ящика": Традиционные модели машинного обучения часто не являются прозрачными, что затрудняет выявление лежащих в основе физических механизмов обнаруженного отказа.
Чтобы решить эти проблемы, недавнее исследование, опубликованное в журнале Measurement, предлагает инновационную и практическую основу: использование физического моделирования для дополнения машинного обучения, а не полагаться исключительно на подгонку данных. Этот подход значительно повышает как объяснимость, так и надежность диагностики неисправностей.
Авторы вводят Random Forest, поддерживаемый термодинамическим моделированием (TSRF)—основу, которая связывает термодинамические механизмы с объяснимым машинным обучением. В условиях ограниченной выборки этот метод достигает высокой диагностической точности при сохранении согласованности с физическими законами, предоставляя существенную ценность для морской инженерии.
Основа TSRF
Основа TSRF интегрирует одномерную термодинамическую модель, классификатор Random Forest (RF) и интерпретатор SHAP (SHapley Additive exPlanations) для создания замкнутой диагностической системы.
- Генерация и Предварительная Обработка Данных: Синтетические наборы данных, охватывающие нормальные и отказные условия, создаются посредством одномерного термодинамического моделирования.
- Обучение и Валидация Модели: Модель Random Forest обучается на предварительно обработанных данных, а производительность оценивается с помощью перекрестной валидации.
- Анализ Объяснимости: Метод SHAP применяется к обученной модели для выявления ключевых термодинамических параметров и количественной оценки их вклада в результаты диагностики.

Основа Random Forest, поддерживаемая термодинамическим моделированием (TSRF)
Построение и Калибровка Одномерной Термодинамической Модели
Основу исследования составляет одномерная термодинамическая модель, предназначенная для моделирования теплового поведения камеры сгорания. Авторы провели тщательную калибровку по отношению к экспериментальным данным, чтобы убедиться, что модель точно отражает термодинамические характеристики в условиях реальной работы. 
Схема одномерной термодинамической модели
Кроме того, модель калибруется с использованием данных, собранных на месте через Модуль сбора данных (DCM). Это гарантирует, что выходные данные моделирования остаются согласованными с ключевыми термодинамическими параметрами, наблюдаемыми при фактической работе двигателя. 
Модуль сбора данных (DCM)
Физическое Моделирование и Моделирование Типичных Отказов
После калибровки авторы ввели целевые возмущения ключевых параметров для моделирования пяти типичных отказов камеры сгорания, убедившись, что каждый отказ подкреплен четким физическим механизмом.
| ID Отказа | Тип Отказа | Физический Механизм | Регулировка ключевых параметров |
|---|---|---|---|
| F1 | Трещина в головке цилиндра | Термомеханическое напряжение приводит к образованию трещин; деградация конструкции/охлаждения. | Увеличить температуру головки (TH) до 346 °C |
| F2 | Эрозия поршня | Деградация материала вызывает тепловую эрозию и увеличение утечек. | Увеличить температуру поршня (TP) + Незначительные утечки (0.01 кг/с) |
| F3 | Износ гильзы цилиндра | Абразивные частицы вызывают геометрическую деформацию и отказ уплотнения. | Увеличить диаметр отверстия + Высокие утечки (0.03 кг/с) |
| F4 | Износ поршневого кольца | Износ вызывает деградацию уплотнения и создает положительную обратную связь утечек. | Отрегулировать скорость массового потока утечек (0.02 кг/с) |
| F5 | Залипание поршневого кольца | Отложение углерода, недостаточная смазка и накопление осадков. | Отрегулировать диаметр отверстия + Увеличить температуру гильзы + Утечки |
Это основанное на механизмах моделирование создает полный и высокого качества набор данных, который служит "основой истины" для машинного обучения.
Выбор признаков посредством RF и SHAP
После установления набора данных алгоритм Random Forest (RF) используется в качестве основного классификатора. Чтобы решить проблему "черного ящика", авторы вводят анализ SHAP для обеспечения глубокого понимания процесса принятия решений моделью.
Выбор признаков следует двухэтапной стратегии:
- Предварительное выявление с RF:
- RF изучает отображение между термодинамическими параметрами и типами отказов.
- Предельные вклады каждого параметра рассчитываются на основе оценок прогноза.
- Количественный анализ с помощью Tree SHAP:
- Значения SHAP рассчитываются для каждого параметра.
- Признаки фильтруются на основе их весов SHAP, отдавая приоритет тем, которые оказывают наибольшее диагностическое воздействие и имеют наиболее ясное физическое значение.

SHAP-based parameter selection process
Экспериментальные результаты и оценка производительности
Экспериментальная валидация демонстрирует эффективность основы TSRF. Даже в условиях ограниченной выборки метод достигает диагностической точности более 95%, значительно превосходя традиционные модели "черного ящика".
Кроме того, анализ SHAP успешно выявляет распределение важности термодинамических параметров по различным типам отказов. Это предоставляет инженерам надежный справочник для анализа коренных причин (RCA), преобразуя простой результат классификации в практическое физическое понимание.