РЕЗУЛЬТАТАМ ИСПЫТАНИЙ

Влияние контроля технического состояния на эксплуатационную надежность АС

Виды контроля технического состояния АС

Цели и задачи технической диагностики АС

Одним из важнейших средств обеспечения и поддержания требуемого уровня надежности АС является техническая диагностика.

Под технической диагностикой понимается область знаний, разрабатывающая методы и средства поиска отклонений в режимах работы (или состояниях) АС, обнаружения и устранения дефектов в системе или ее элементах и средства их локализации [6].

В состав задач технического диагностирования, нормированных ГОСТ 20911-89, входят:

- определение располагаемого (остаточного) на момент диагностирования ресурса работоспособности системы (элемента);

- поиск места и определение причины отказа;

- прогнозирование технического состояния, целью которого является определение с заданной вероятностью интервала времени (ресурса), в течение которого сохранится работоспособное (исправное) состояние объекта, или вероятности сохранения работоспособного (исправного) состояния объекта на заданный интервал времени.

Кроме основных задач технического диагностирования в производственной практике существует ещё ряд задач, которые, без сомнения, представляют практический интерес.

Одна из них – выявление первопричины возникновения и механизма развития дефекта (вследствие чего возник дефект?). Эта задача состоит из двух достаточно самостоятельных задач:

1) выявление предпосылок развития дефекта (например, конструктивный недостаток, скрытый дефект применённого материала, несовершенство использованной технологии изготовления, недостаточный ресурс отдельных узлов или элементов и т.д.);

2) выявление механизма развития дефекта и, возможно, способствовавших развитию дефекта погрешностей и нарушений режима эксплуатации системы.

Ещё одна диагностическая задача сопутствует названной высшей главной диагностической задаче (определение ресурса работоспособности) и является её продолжением или развитием, но, тем не менее, имеет и важное самостоятельное значение.

Наиболее очевидный способ определения оставшегося ресурса сложного технического устройства – это выявление узла, детали, составной части с наименьшим оставшимся ресурсом (принцип наиболее слабого звена). Для этого надо учесть все составные части, все возможные дефекты в каждой из них, влияние каждого дефекта и скорости его развития на утрату располагаемого ресурса. Но за любым выявленным слабейшим звеном всегда может обнаружиться другое, чуть менее слабое звено. Поэтому, кроме оценки остаточного ресурса на текущий момент, большое значение имеет возможность оценки перспективы восстановления ресурса. Другими словами, большой интерес представляет ответ на вопрос: сколько и каких дефектов необходимо устранить, чтобы достичь желаемого уровня ресурса работоспособности? Таким образом, можно сформулировать ещё одну, представляющую практический интерес диагностическую задачу: оценка имеющийся перспективы восстановления ресурса работоспособности. Иногда трактовку этой задачи можно встретить в несколько иной форме, например, как определение объёма ремонтно-восстановительных работ.

Следующая задача, которая является продолжением и развитием полезных возможностей диагностических процедур, - управление развитием выявленных дефектов. Другими словами – это выработка рекомендаций по режимам, условиям эксплуатации системы (устройства), соблюдение которых позволит приостановить или замедлить развитие дефекта. Понятно, что решение этой задачи будет базироваться на предварительном решении задачи выявления причин возникновения и развития выявленных дефектов.

Между распознаванием причин возникновения дефекта и управлением его развитием можно выделить ещё одну важную связующую задачу – это создание модели процесса развития дефекта. Решение этой задачи столь же необходимо и для выявления зависимости остаточного ресурса от каждого конкретного дефекта.

Структурную взаимосвязь перечисленных задач диагностики можно проиллюстрировать схематически (рис. 4.1):

 

Рис. 4.1 Структурная взаимосвязь задач диагностики

 

Имея полную информацию о выявленных дефектах и о возможном влиянии каждого из них на остаточный ресурс системы, можно без особых затруднений решить задачу определения объёма восстановительных работ, необходимого для доведения ресурса работоспособности системы до требуемого уровня.

 

Любая АС может нормально функционировать тогда и только тогда, когда создается возможность получать непрерывно информацию о ее техническом состоянии. Осуществить получение такой информации с помощью некоторого одного универсального метода невозможно из-за большого разнообразия элементов АС и их функционального назначения. Процесс создания АС всегда сопровождается процессом поиска наиболее подходящих методов контроля технического состояния системы и ее частей.

Рассмотрим классификацию существующих видов контроля [11].

1. По целевому назначениюразличают:

- контроль работоспособности, который осуществляется с целью определения текущего технического состояния АС (работоспособное или неработоспособное);

- диагностический контроль, который определяет причину неисправности (отказа) АС, если она находится в неисправном (неработоспособном) состоянии;

- прогнозирующий контроль предназначен для определения возможных отказов в системе в ближайший момент времени, с тем, чтобы своевременно принять меры по их предотвращению.

2. По степени автоматизации различают:

- автоматический контроль, который осуществляется специальными устройствами и программой без вмешательства человека-оператора;

- автоматизированный контроль – с частичным вмешательством человека;

- ручной контроль – без средств автоматизации.

3. По временным характеристикам различают:

- периодический контроль;

- непрерывный контроль.

4. По полноте контроля различают:

- полный контроль;

- частичный контроль.

5. По последовательности контрольных операций:

- последовательный контроль, при котором элементы АС контролируются последовательно одно за другим;

- параллельный контроль, при котором элементы АС контролируются одновременно.

6. По используемым методам контроль бывает:

- прямой контроль, который основан на непосредственном (прямом) измерении параметров, определяющих техническое состояние системы. Он может быть программным и аппаратурным;

- косвенный контроль, который основан на наблюдениях косвенных (побочных, сопутствующих) признаков, которые могут быть использованы для определения или прогнозирования технического состояния (повышенный нагрев, повышенный шум и т. д.).

Программный контроль основан на использовании специальных программ. Он, в свою очередь, подразделяется на контроль программно-логический и тестовый.

Программно-логический контроль предназначен для контроля за правильностью функционирования АС и ее отдельных элементов. Правильность функционирования может быть проверена повторением операций переработки информации или повторной пересылкой информации, а также с помощью сравнения получаемых результатов с эталонными.

Тестовый контроль (тестирование) предназначен для проверки состояния аппаратуры и программ с помощью специальных испытательных (тестовых) программ. На вход проверяемого объекта подается определенный набор входных данных, которому должен соответствовать определенный набор выходных данных. Анализ выходных данных позволяет определить состояние объекта и даже причину неисправного состояния.

Тестирование – основной метод измерения качества, определение корректности и реальной надежности функционирования программ на любых этапах разработки. Результаты тестирования и измерения показателей качества должны сравниваться с требованиями технического задания для определения степени соответствия предъявлявшимся требованиям, полученным разработчиком от заказчика. Такие достаточно полные эталоны, как совокупность требований технического задания и поэтапная их декомпозиция в спецификациях, необходимы для тестирования при промежуточных и завершающих испытаниях.

Важная особенность тестирования сложных ПС – необходимость достаточно полной их проверки при ограниченной длительности испытаний. Это определяет целесообразность тщательного планирования тестирования с учетом всех результатов, полученных на предыдущих этапах разработки. При планировании основная задача состоит в достижении максимальной достоверности испытаний, определения качества и надежности ПС при ограниченных затратах ресурсов на проведение тестирования.

Аппаратурный контроль – это контроль, осуществляемый с помощью специальной контрольной аппаратуры, введенной в структуру системы. Контрольная аппаратура работает одновременно с основной. Большое разнообразие контролируемых объектов и широкие возможности в выборе методов контроля, каждый из которых обладает своими недостатками и преимуществами в конкретных условиях применения, привели к тому, что в инженерной практике используются многочисленные методы аппаратурного контроля. Наиболее распространенными являются: числовой по модулю; кодовый по модулю; аппаратурно-микропрограммный; мажоритарный; с использованием корректирующих кодов, шлейфовых каналов, контрольных сумм; основанный на проверке запрещенных выходных слов и запрещенных переходов.

Числовой контроль по модулю основан на том, что существуют вполне определенные соотношения между результатами операций над числами и результатами таких же операций над остатками от деления чисел на некоторый делитель. Делитель называется модулем, а остаток от деления на модуль – вычетом.

Рассмотрим применение числового контроля по модулю на элементарном примере.

Двоичное число А может быть представлено в виде

Вычет (остаток от деления числа А на модуль q):

где ri - вычет от деления 2i на модуль q.

При заданном значении модуля q значения ri становятся вполне определенными. Для q=3, например, они равны r0=1; r1=2; r2=1; r3=2 и т. д. Поэтому вычет из числа А при известном модуле q легко определить по следующей схеме, на которой Ci - простейшие сумматоры на два выхода (рис. 4.2).

Рис. 4.2 Схема определения вычета

 

Операция определения ra путем последовательного суммирования называется сверткой. Эта операция облегчается тем, что ai могут принимать значения либо 0, либо 1, а ri - периодически повторяющиеся числа. Поэтому определение airi не требует специальных устройств, а осуществляется при вводе числа А.

С помощью вычетов можно осуществлять проверку правильности операции сложения и умножения, так как вычет суммы равен сумме вычетов, а вычет произведения двух чисел равен произведению вычетов этих чисел. Если в аппаратуре, например, непрерывно производится суммирование двух чисел, то дополнительной контрольной аппаратурой производится проверка совпадения.

В случае расхождения фиксируется отказ в выполнении операции суммирования.

Кодовый контроль по модулю отличается от числового контроля по модулю тем, что при этом контроле осуществляются операции с вычетами от суммы цифр двоичного слова без учета их «веса», т. е. без учета того, к какому разряду принадлежат эти цифры.

Пусть, например, по каналу передается «слово»:

Перед тем как послать это «слово» в канал, определяется сумма и в случае необходимости дополняется дополнительным разрядом так, чтобы вычет, т. е. остаток от деления на модуль q, был равен вполне определенному числу. Вычет числа, получаемый на выходе канала, контролируется. В случае расхождения с ожидаемым результатом фиксируется отказ в выполнении поставленной задачи пересылки информации.

Обычно используют модуль, равный 2, и вычет, равный либо 1 (при проверке на нечетность), либо 0 (при проверке на четность). При туком контроле обнаруживается невыполнение функции передачи информации, если имели место ошибки, т. е. запись 1 вместо 0 и наоборот в одном, трех, пяти, семи, т. е. в нечетном числе разрядов. Для обнаружения ошибки в большем числе случаев необходимо увеличение значение модуля, но это потребует усложнения контрольной аппаратуры.

Контроль с использованием корректирующих кодов основан на том, что числа, используемые либо при вычислениях, либо при передаче по каналам связи, кодируются так, что в них вводятся дополнительные контрольные разряды, позволяющие не только обнаруживать ошибки, но и исправлять их. Наиболее распространены корректирующие коды Хемминга. Вероятность исправления ошибок при передаче информации зависит от кратности ошибок и от надежности контрольной аппаратуры. Одиночные ошибки при безотказной работе контрольной аппаратуры исправляются с вероятностью, практически равной 1.

Аппаратурно-микропрограммный контроль – контроль правильности выполнения программы. Программа при этом разбивается на независимые части (микропрограммы)и каждая часть контролируется с помощью специальной контрольной аппаратуры, которая реализует контрольные микропрограммы либо во время основной работы системы, либо в период ее простоев. С помощью такого контроля выявляются ошибки выполнения арифметических операций, ошибки, возникающие при хранении, выдаче и записи информации, ошибки в работе переключающих устройств и т. п. Контроль может обеспечивать не только выявление ошибок с индикацией результата, но также исправление ошибок, переключение на другой режим работы, подключение резервного оборудования, восстановление информации и т. п.

Мажоритарный контроль – контроль, основанный на сравнении результатов работы двух (и более) устройств. Такой контроль осуществляется при мажоритарном резервировании, которое обеспечивает повышение надежности, повышение достоверности и в то же время позволяет осуществить мажоритарный контроль. Это видно из рис. 6.3, где представлено мажоритарное резервирование «два из трех». Если сигналы с логических элементов 1-2, 2-3, 1-3 подать на блок анализа, то по характеру этих сигналов (0 или не0), а также по комбинации этих сигналов можно сделать заключение об исправности основных элементов 1-3 и устройств сравнения 1-2, 2-3, 1-3, т. е. Осуществить мажоритарный контроль состояния устройства. Например, при неисправном элементе 1 и исправных элементах 2 и 3 на выходе элемента 1-2 и элемента 1-3 будет зафиксировано отсутствие сигнала.

 

о о о

Рис. 4.3 Схема мажоритарного контроля

 

Контроль с использованием шлейфовых каналов применяется для проверки исправности каналов передачи данных. Приемная и передающая части объединяются с помощью шлейфового канала, образуя замкнутый контур, в котором передаваемая информация сравнивается с принимаемой. При несовпадении формируется сигнал о неисправности канала.

Контроль с использованием контрольных сумм заключается в том, что одновременно с передачей некоторого массива информации передается «контрольная сумма» (сумма числа знаков в кодограмме и т. п.). На приемном пункте проверяется принятое значение «контрольной суммы» и сопоставляется с требуемым значением. Несовпадение – признак ошибки в переданном массиве информации.

Контроль запрещенных «слов», состояний и переходов состоит в том, что предварительно устанавливается, какие «слова», состояния и переходы следует считать запрещенными. Например, запрещенным может быть значение синуса больше 1. Появление таких запрещенных «слов», состояний или переходов – признак нарушения функционирования системы.

 

Выбор вида контроля, а также его метода зависит от особенностей контролируемого объекта и требований, предъявляемых к его характеристикам. Можно высказать следующие ориентировочные справочные характеристики программного и аппаратурного контроля [11].

Достоинство программного контроля:

- не требует значительных затрат и не усложняет состава системы;

- обладает широкими возможностями – может выполнять функции контроля состояния, диагностирования и прогнозирования, а также контроля за выполнением заданных функций.

Недостатки программного контроля:

- полное или частичное выполнение основных функций контролируемой системы;

- усложнение программного обеспечения АС;

- увеличение объема аппаратуры памяти;

- усложнение переключающих устройств и рабочих режимов АС.

Достоинство аппаратурного контроля:

- не требует отключения АС, поэтому не приводит к снижению ее производительности;

- непрерывно обеспечивает контроль работоспособности, диагностирование и прогнозирование состояния АС с высокой степенью достоверности;

- позволяет легко осуществить устранение последствий отказов (переключение на резервные устройства, исправление информации и т. д.).

Недостатки аппаратурного контроля:

- значительные затраты на изготовление встроенной контрольной аппаратуры;

- увеличение структурной сложности, габаритных размеров, массы систем.

Оценить влияние контроля на эксплуатационную надежность контролируемых АС весьма сложно. О влиянии контроля на надежность АС в общих чертах можно сказать следующее:

1. Контроль, рассматриваемый в узком смысле этого термина, т. е. только как средство обнаружения состояния АС, не может влиять на повышение ее надежности. Влияние контроля на повышение надежности обнаруживается тогда, когда он сопровождается восстановлением работоспособности, исправлением обнаруженных ошибок, устранением неблагоприятных явлений, обнаруженных в процессе контроля.

2. Контроль и диагностика в сочетании с восстановлением оказывают существенное влияние на показатели надежности АС по следующим основным направлениям:

а) контроль обеспечивает нормальное функционирование АС в заданной конфигурации и в заданных режимах; позволяет определить степень ее готовности к включению, время переключения на резерв, необходимость формирования резервных направлений передачи данных. Без средств контроля и диагностики невозможно нормальное функционирование таких больших систем, как АС;

б) контроль и восстановление повышают показатели безотказности АС. Одним из показателей качества контроля служит время, затрачиваемое на восстановление работоспособности, а оно существенно влияет на коэффициент готовности АС;

в) контроль повышает достоверность информации при ее хранении, переработке и пересылке. Кодовый контроль по модулю 2 позволяет обнаружить все одиночные ошибки, т. е. ошибки в одном разряде кодовой комбинации. Кодовый контроль по модулю 3 дает возможность обнаружить ошибки, число которых не кратно 3; кодовый контроль по модулю 5 – ошибки, число которых не кратно 5.

Таким образом, увеличение модуля позволяет повысить достоверность кодового контроля, но приводит к усложнению контрольной аппаратуры;

г) усложнение основной аппаратуры за счет включения дополнительной контрольной аппаратуры может привести к снижению аппаратурной надежности, а ошибки в результатах контроля – к снижению достоверности.

д) контроль с использованием корректирующих кодов позволяет свести время устранения ошибки к пренебрежимо малому значению, но требует еще большего усложнения аппаратуры.

Более детальный анализ количественного влияния контроля и восстановления на показатели надежности требует учета двойственного характера влияния контроля на надежность контролируемой системы. Это означает, что при проектировании системы контроля необходимо проводить либо расчет, либо моделирование надежности АС с учетом влияния контроля и на основании такого расчета выбирать оптимальную стратегию контроля.

В самом общем виде рекомендация по проектированию контроля в АС может быть сформулирована следующим образом: в основу системы контроля должен быть положен системный принцип (подход), т. е. организация контроля должна учитывать многосторонний характер влияния контроля на характеристики АС и представлять по своей структуре сложную систему, в которой должны сочетаться различные методы и средства контроля. Система контроля должна иметь многоуровневый характер: на первом, самом низком, уровне – контроль состояния отдельных технических средств; на втором – контроль выполнения функциональных задач, решаемых различными подсистемами; на третьем – объединение всех видов контроля в единую систему, позволяющую получить информацию о состоянии системы и ее функционировании, а также управлять системой путем реорганизации ее структуры, подключения резервных средств, вывода отдельных технических средств на профилактику, применения приоритетного принципа обработки информации и т. д.

Глава 5. ОЦЕНКА НАДЕЖНОСТИ АС ПО