УПРАВЛЕНИЕ НАДЁЖНОСТЬЮ
Надёжность — свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных условиях применения, технического обслуживания, хранения и транспортирования.
Интуитивно надёжность объектов связывают с недопустимостью отказов в работе. Это есть понимание надёжности в «узком» смысле — свойство объекта сохранять работоспособное состояние в течение некоторого времени или некоторой наработки. Иначе говоря, надёжность объекта заключается в отсутствии непредвиденных недопустимых изменений его качества на стадии эксплуатации (при его использовании, обслуживании, хранении, транспортировании). Надёжность — комплексное свойство, которое в зависимости от назначения объекта и условий его эксплуатации может включать в себя свойства безотказности, долговечности, ремонтопригодности и сохраняемости, а также определённое сочетание этих свойств.
Для количественной оценки надёжности используют так называемые единичные показатели надёжности (характеризуют только одно свойство надёжности) и комплексные показатели надёжности (характеризуют несколько свойств надёжности в определённом интервале времени).
Основные понятия и определения:
Безотказность — свойство объекта непрерывно сохранять работоспособное состояние в течение некоторого времени или наработки.
Ремонтопригодность — свойство объекта, заключающееся в его приспособленности к восстановлению работоспособного состояния при отказе или повреждении объекта или его составных частей.
Долговечность — свойство объекта непрерывно сохранять работоспособность от начала эксплуатации до наступления предельного состояния, то есть такого состояния, когда объект изымается из эксплуатации.
Сохраняемость — свойство объекта сохранять работоспособность в течение всего периода хранения и транспортировки.
Живучесть — свойство объекта сохранять работоспособность при отказе отдельных функциональных узлов.
Отказ — событие, заключающееся в полной или частичной утрате работоспособности.
Сбой — самоустраняющийся отказ или однократный отказ, устраняемый незначительным вмешательством оператора.
Наработка на отказ — величина, (время или объём работы) принятая для измерения продолжительности работы аппаратуры.
Ресурс — наработка от начала эксплуатации до наступления предельного состояния.
Срок службы — календарная продолжительность от начала эксплуатации до наступления предельного состояния.
Нормирование надёжности.
Для любой системы одной из первых инженерных задач надёжности является адекватное нормирование показателей надёжности, например, в терминах требуемой готовности. Нормирование надёжности — это установление в проектной или иной документации количественных и качественных требований к надёжности. Требования по надёжности относятся как к самой системе и её составным частям, так и к планам испытаний, к точности и достоверности исходных данных, формулированию критериев отказов, повреждений и предельных состояний, к методам контроля надёжности на всех этапах жизненного цикла изделия. Например, требования по ремонтопригодности могут включать в себя показатели стоимости и времени восстановления. Оценивание эффективности процессов технического обслуживания и ремонта является частью процесса FRACAS (failure reporting, analysis and corrective action system — система отчётов об отказах, анализа и коррекции действий).
Параметры системной надёжности.
При анализе параметров системной надёжности учитывается структура системы, состав и взаимодействие входящих в неё элементов, возможность перестройки структуры и алгоритмов её функционирования при отказах отдельных элементов.
Наиболее часто в инженерной практике рассматривают последовательное, параллельное, смешанное (последовательно-параллельное и параллельно-последовательное) соединение элементов системы, а также схемы типа «K из N», мостиковые соединения.
По возможности восстановления и обслуживания системы подразделяются на восстанавливаемые и невосстанавливаемые, обслуживаемые и необслуживаемые. По режиму применения (функционирования) — на системы непрерывного, многократного (циклического) и однократного применения.
В основном, в качестве параметра надёжности используется среднее время до отказа (MTTF), которое может быть определено через интенсивность отказов или через число отказов на заданном отрезке времени. Интенсивность отказов математически определяется как условная плотность вероятности возникновения отказа изделия при условии, что до рассматриваемого момента времени отказ не произошёл. При увеличении интенсивности отказов среднее время до отказа уменьшается, надёжность изделия падает. Обычно среднее время до отказа измеряется в часах, но также может выражаться в таких единицах, как циклы и мили.
В других случаях надёжность может выражаться через вероятность выполнения задачи. Например, надёжность полётов гражданской авиации может быть безразмерной, или иметь размерность в процентах, как это делается в практике системной безопасности. В отдельных случаях успешным результатом системы может являться единоразовое срабатывание. Это актуально для систем, которые рассчитаны на срабатывание всего 1 раз: например, подушки безопасности в автомобиле. В этом случае задаётся вероятность срабатывания или, как, например, для ракет, вероятность попадания в цель. Для таких систем мерой надёжности является вероятность срабатывания. Для восстанавливаемых систем может задаваться такой параметр, как среднее время восстановления (ремонта) и время проверки (тестирования). Часто параметры надёжности задаются в виде соответствующих статистических доверительных интервалов.
Надёжность на этапе проектирования.
Надёжность на этапе проектирования является новой дисциплиной и относится к процессу разработки надёжных изделий. Этот процесс включает в себя несколько инструментов и практических рекомендаций и описывает порядок их применения, которыми должна владеть организация для обеспечения высокой надёжности и ремонтопригодности разрабатываемого продукта с целью достижения высоких показателей готовности, снижения затрат и максимального срока службы продукта. Как правило, первым шагом в этом направлении является нормирование показателей надёжности. Надёжность должна быть «спроектирована» в системе. При проектировании системы назначаются требования к надёжности верхнего уровня, затем они разделяются на определённые подсистемы разработчиками, конструкторами и инженерами по надёжности, работающими вместе. Проектирование надёжности начинается с разработки модели. При этом используют структурные схемы надёжности или деревья неисправностей, при помощи которых представляется взаимоотношение между различными частями (компонентами) системы.
Одной из наиболее важных технологий проектирования является введение избыточности или резервирование. Резервирование — это способ обеспечения надёжности изделия за счёт дополнительных средств и (или) возможностей, избыточных по отношению к минимально необходимым для выполнения требуемых функций (ГОСТ 27.002). Путём введения избыточности совместно с хорошо организованным мониторингом отказов, даже системы с низкой надёжностью по одному каналу могут в целом обладать высоким уровнем надёжности. Однако введение избыточности на высоком уровне в сложной системе (например, на уровне двигателя самолёта) очень сложно и дорого, что ограничивает такое резервирование. На более низком уровне системы резервирование реализуется быстро и просто, например, использование дополнительного соединения болтом.
Существует много методик анализа надёжности, специфических для отдельных отраслей промышленности и приложений. Наиболее общие из них следующие:
- Анализ видов и последствий отказов (АВПО)
- Имитационное моделирование надёжности
- Анализ схем функциональной целостности (СФЦ)
- Анализ опасностей (Hazard analysis)
- Анализ структурных схем надёжности (RBD)
- Анализ деревьев неисправностей
- Ускоренные испытания
- Анализ роста надёжности
- Вейбулл-анализ (анализ эмпирических данных из испытаний и эксплуатации)
- Анализ смеси распределений
- Устранение критичных отказов
- Планирование технического обслуживания, обеспечивающего надёжность (RCM)
- Анализ диагностики отказов
- Анализ ошибок человека-оператора
Инженерные исследования проводятся для определения оптимального баланса между надёжностью и другими требованиями и ограничениями. Существенную помощь при инженерном анализе надёжности могут оказать программные комплексы для расчёта надёжности.
Оценка надёжности техники на стадии эксплуатации.
После того, как система изготовлена, осуществляется мониторинг её надёжности, оцениваются и корректируются недоработки и недостатки. Мониторинг включает в себя электронное и визуальное наблюдение за критическими параметрами, выявленными на стадии проектирования при разработке дерева неисправностей. Для обеспечения заданной надёжности системы данные постоянно анализируются, используя статистические методы, такие как Вейбулл-анализ и линейная регрессия. Данные о надёжности и оценки параметров являются ключевыми входами для модели системной логистики.
Одним из наиболее общих методов для оценивания надёжности техники при эксплуатации являются системы отчётов, анализа и коррекции действий (FRACAS). Систематический подход к оцениванию надёжности в определённом интервале времени, безопасности и логистики основан на отчётах об отказах и авариях, менеджменте, анализе корректирующих/предупреждающих действий.
Системная надежность определяет способность технологической системы реагировать на возникающие нарушения и спасать режим функционирования. Надежность отдельных единиц оборудования определяется их вероятностной способностью выполнять свои функции в заданных условиях эксплуатации. Здесь, а ключевую роль в управлении надежностью играет система поддержания уровня работоспособности на требуемом уровне.
Классические подходы к этому вопросу страдают одним общим недостатком: планирование деятельности по поддержанию надежности слабо связано с ее естественным ожидаемым результатом – её (надежности) повышением. Причины этого – усредненный подход к оборудованию, отсутствие понимания индивидуальных аспектов эксплуатации каждой единицы, планирование обслуживания и ремонтов без учета бизнес-целей предприятия, имеющихся рисков и ограничений. Как следствие – ремонтируется то, что не нужно, отказывает то, что должно еще было работать, потери всех видов растут, при том, что затраты на содержание тоже не снижаются.
Универсальным решением указанных проблем является такой подход к эксплуатации и содержанию оборудования, при котором каждая единица оборудования рассматривается как непрерывный фактор риска для бизнес-задач предприятия. Основной целью деятельности по содержанию оборудования является максимально возможное сокращение риска в имеющихся условиях и ограничениях. При такой постановке вопроса управление надежностью превращается из обеспечивающей затратной деятельности в инструмент решения текущих бизнес-задач – повышения прибыли за счет более эффективного использования оборудования, снижения накладных затрат при сохранении нагрузки на оборудование.
Основная управленческая проблема, связанная с обеспечением надежности, – это необходимость найти компромисс между желанием сэкономить на затратах на оборудование и желанием избегать аварий, простоев и потерь от них. Как правило, найти такой компромисс не получается, и в реальной жизни «побеждает» одна из точек зрения – либо во главу угла ставится надежность, зачастую в ущерб экономической целесообразности, либо производственные фонды эксплуатируются «на износ», обеспечивая максимальную отдачу «на сегодня».
В обоих случаях ситуация усугубляется такими объективными факторами, как серьезный износ основных фондов, его возрастная и технологическая разнородность, снижение профессионального уровня эксплуатирующего и ремонтного персонала, снижение качества производимых запасных частей и комплектующих, эксплуатация оборудования в предельных и запредельных режимах нагрузки, устаревшая, не отвечающая реалиям нормативная и регламентная база процессов эксплуатации, обслуживания и ремонтов.
Радикально решить указанные выше проблемы можно путем полной модернизации технологической базы, с переходом на сервисное обслуживание или на эксплуатацию «без обслуживания». Но этот путь весьма затратен. Более прагматичный подход – создание такой системы управления производственными активами, при которой компромисс между затратами и надежностью найти можно.
Такой подход должен ставить перед собой задачу поиска баланса между потенциальным риском потерь, связанным с эксплуатацией оборудования, и затратами на его устранение. Здесь ключевыми являются ответы на два вопроса:
• какова вероятность и сроки наступления нежелательных событий и потерь от них?
• каков оптимальный план действий по упреждению нежелательных событий в сложившихся ограничениях (финансовых, трудовых, технологических и пр.)?
Актуальность данного подхода обусловила появление на рынке программного обеспечения систем нового класса – прогнозное обслуживание (Predictive Maintenance).
Системы такого класса являются развитием, расширением возможностей классических систем управления активами (EAM) и ТОиР и предназначены для планирования работ по заменам, техническому обслуживанию и ремонтам исходя из фактических реалий – текущего и прогнозируемого состояния оборудования, условий эксплуатации, производственных планов и ограничений, целевых КПЭ предприятия. Такие системы позволяют непосредственно в ходе эксплуатации оборудования выполнять оценку их технического состояния – ожидаемых сроков развития дефектов до критического уровня, возможных видов и последствий функциональных отказов и нарушений по их вине.
Данная информация служит основой для планирования упреждающих воздействий, своевременное выполнение которых позволяет сократить количество аварийных и внеплановых ремонтов, минимизировать время простоя оборудования, повысить производственную безопасность, минимизировать последствия негативного влияния на окружающую среду, страховые издержки и прочие риски.
Алгоритм планирования в рамках данного подхода в общем виде представляет собой следующую последовательность:
I. В ходе регулярных и попутных диагностик, осмотров, обслуживания и ремонтов собираются различные объективные показания, характеризующие текущее состояние оборудования, условия его эксплуатации и прочие сопутствующие данные.
II. На основании этих данных производится определение вида и степени развития неисправностей / дефектов, определяется прогнозный остаточный ресурс оборудования по каждой такой неисправности – времени, оставшегося до достижения критического уровня развития, при котором дальнейшая эксплуатация будет невозможна. Прогнозирование производится на основании регрессионной модели, специфической для каждого вида дефекта, в которой в качестве исходных данных выступает вся история эксплуатации и ремонтов конкретной единицы оборудования.
III. По каждому выявленному дефекту определяются возможные последствия в случае, если по его причине наступит отказ. Последствия определяются по всем аспектам безопасности – экономические потери от простоя, затраты на устранение последствий отказа / аварии, риски для людей, окружающей среды и пр.
IV. По каждому из дефектов определяется необходимый и достаточный вид, состав и объем упреждающих ремонтных работ. Формируется предварительный план, в котором даты исполнения каждой из работ определяются остаточным ресурсом по соответствующему дефекту. Такой план обеспечивает максимальную надежность оборудования, но не учитывает экономические и производственные реалии.
V. На базе такого предварительного плана формируется оптимальный рабочий график ТОиР, сбалансированный по заданным КПЭ: надежность, затраты на ТОиР, полезная отдача от оборудования, стоимость владения активами и пр. Далее такой план утверждается и поступает в службы на обеспечение и исполнение.
Управление надежностью как система естественным образом позволит «навести порядок» во всех важнейших аспектах организации деятельности предприятия – процессы и регламенты, персонал, НТД и НСИ, техническая политика и стандарты, данные и программное обеспечение. Во всех этих областях система «потребует» внести большую четкость, ясность и ответственность.
Способствует этому международный опыт, обобщенный в рамках различных методик, подходов и стандартов. Это такие методики, как RCM (обслуживание на надежность), FMEA (анализ видов и причин отказов), RBI (диагностика, основанная на оценке рисков) и пр. При «наведении порядка» в процессах, регламентах, квалификации персонала хорошим ориентиром может стать стандарт PAS 55 (ISO 55000). В рамках cистемы управления надежностью все эти стандарты обретают четкий практический смысл, переставая быть абстрактными упражнениями или «новомодными штучками».
Для российской промышленности описанный подход не нов. Разрабатывались методики оценки состояния и риска, проводилась автоматизация расчетов таких оценок. Но на сегодняшний день, можно сказать, «воз и ныне там». Явных провалов, казалось бы, не было, но и успешными такие проекты назвать нельзя. В чем, на наш взгляд, причины неуспеха? Мы видим две ключевые проблемы:
I. Мы не знаем ни одного проекта, который был бы доведен до решения полного круга задач – от мониторинга и оценки состояния до реального планирования работ и бюджетов ТОиР. Все попытки, так или иначе, останавливались на каком‑то этапе, не доходя до конца. В результате такие системы оставались «вещью в себе», не встраивались в реальный процесс принятия решений по эксплуатации и ТОиР и постепенно уходили в забвение.
II. В ряде случаев дополнительной проблемой становился неверный выбор программного решения, нужного для автоматизации процессов нетривиальных расчетов на больших объемах исходных данных. Наиболее показательный пример – это попытка «доработать» до решения задач управления надежностью распространенную в российской энергетике систему SAP ERP.
ИТАК, при условии организации системного подхода к управлению надежностью можно проблемную, затратную деятельность по содержанию оборудования превратить в инструмент решения бизнес-задач: повышения прибыли за счет более эффективного использования оборудования, снижения накладных затрат при сохранении нагрузки на оборудование. Насколько – вопрос индивидуальный, но на практике специалистов нашей компании 25‑20 процентов сокращения совокупных затрат на содержание оборудование – цель вполне достижимая.