Выпуск #1/2021
К. ПОТАПОВ, А. КОМШИН, А. СЫРИЦКИЙ
ПЕРСПЕКТИВЫ ИСПОЛЬЗОВАНИЯ НЕЙРОННЫХ СЕТЕЙ В ФАЗОХРОНОМЕТРИИ
ПЕРСПЕКТИВЫ ИСПОЛЬЗОВАНИЯ НЕЙРОННЫХ СЕТЕЙ В ФАЗОХРОНОМЕТРИИ
Просмотры: 1288
DOI: 10.22184/2499-9407.2021.22.1.60.63
Показано использование однослойного перцептрона с учителем для диагностики состояния подшипника переднего шпиндельного узла токарного станка в двух состояниях: норма (0), подшипник не затянут (1), в рамках фазохронометрического подхода к диагностике циклических машин и механизмов.
Рассмотрен подбор параметров для оптимальной конфигурации нейронной сети.
Показано использование однослойного перцептрона с учителем для диагностики состояния подшипника переднего шпиндельного узла токарного станка в двух состояниях: норма (0), подшипник не затянут (1), в рамках фазохронометрического подхода к диагностике циклических машин и механизмов.
Рассмотрен подбор параметров для оптимальной конфигурации нейронной сети.
Теги: bearing dropout epoch mathematical model neural network perceptron phase-chronometric method дропаут математическая модель нейронная сеть перцептрон подшипник фазохронометрический метод эпоха
Сегодня нейронные сети находят все большее применение в науке, технике, медицине, торговле и прочих отраслях. Хотя само понятие нейронных сетей возникло еще в 1943 году [1], а первый перцептрон появился в 1958 году [2], до их полноценного применения прошло полвека. Это связано с тем, что до появления Интернета отсутствовало понятие «больших данных», а как оказалось, нейронные сети эффективны в обработке именно больших объемов информации и не раскрывают своего потенциала в других случаях.
Искусственные нейронные сети (ИНС) в задачах диагностирования и прогнозирования технического состояния машин и механизмов могут быть использованы в качестве подсистемы выборки и принятия решений, передающей диагностическую информацию другим подсистемам управления [3].
Для решения задач диагностирования и прогнозирования необходимо сформировать базу с множеством состояний и произвести оценку степени влияния каждого информационного параметра на вероятность перехода машины или механизма в какое-либо из возможных состояний [3].
В рамках данного материала описывается опыт применения простейшего перцептрона к решению задачи технической диагностики фазохронометрическим методом (ФХМ) [4].
При ФХМ-диагностике единственным измеряемым параметром является время, а точнее вариации интервалов времени, которые проецируются по заданным алгоритмам на идеальный образец (или модель), после чего, на основании сравнения с ней, делается вывод о состоянии узла на момент измерения.
В качестве объекта исследования был выбран передний подшипниковый узел токарного станка 16К20Ф3. На указанном станке производились измерения для двух состояний переднего подшипника ‒ отрегулированное и ослабленное, на разных частотах холостого хода шпинделя ‒ 315 и 1000 об/мин. Полученные хронограммы вращения обрабатывались стандартными для метода способами, включающими в себя построение АКФ и ее спектра. С помощью математической модели обработанные данные были интерпретированы и сделаны верные выводы о состоянии подшипника. Перед нейронной сетью ставилась такая же задача, то есть задача правильной идентификации. Для этих целей, с помощью библиотек Keras [5] и TensorFlow [6] языка программирования Python, разработан однослойный перцептрон, схема которого показана на рис. 1.
Конфигурация перцептрона:
слои:
Использование модели перцептрона в данном случае оправдано тем, что подобные нейронные сети хорошо справляются с задачами классификации. Непрерывный ряд интервалов времени, разбитый на отдельные циклы, можно представить как некий одномерный образ, индивидуальный для каждого состояния механизма или узла механизма. В этом плане данная задача близка к задаче идентификации изображений.
Необходимо отметить, что количество нейронов входного и выходного слоя было выбрано не случайным образом. Так как входной массив данных имеет 625 элементов, то логично было установить такое же количество нейронов входного слоя, и так как на данный момент стоит задача определения самого факта наличия дефекта ‒ без его классификации, то выходной слой имеет всего два нейрона – это 0 (нет дефекта) и 1 (есть дефект).
Входные данные для нейронной сети подготовлены следующим образом:
Обучение перцептрона производилось на 50 эпохах, при этом значения весовых коэффициентов, обеспечивающих наилучшую точность, сохранялись в файл.
В результате проведенных вычислений нейронная сеть продемонстрировала следующие результаты:
Разница в вероятностях для 315 и 100 об/мин обусловлена тем, что результаты измерений для 315 об/мин сильнее зашумлены.
Далее изучено влияние отдельных параметров нейронной сети на вероятность верной идентификации. При построении графиков использовались данные, полученные путем многократных измерений с оценкой неопределенности вероятности верной идентификации:
При увеличении количества эпох происходит закономерный рост точности как на тренировочных, так и на проверочных данных (рис. 2). Вертикальными отрезками показаны доверительные интервалы для каждого значения эпохи при доверительной вероятности Р = 0,9973 и предположении о нормальности распределения. Хорошо видно, что при малом числе эпох вероятность правильной идентификации имеет существенную неопределенность, но уже после 25-ой эпохи неопределенность ощутимо уменьшается и достигает минимума к 30-ой эпохе (рис. 3), что является оптимальным числом для тренировки нейронной сети. Дальнейший рост количества эпох приводит к постепенному снижению вероятности верной идентификации на тестовой выборке и не сокращает неопределенность на ней.
При увеличении вероятности обнуления весовых коэффициентов, так называемом дропауте (метод регуляризации нейронной сети для предотвращения переобучения), вероятность правильной идентификации испытывает незначительные колебания в районе значения 0,95 для тестовой выборки и ощутимо падает для тренировочной при условии, что дропаут более 0,5 (рис. 4). Наименьшая неопределенность на тестовой выборке достигается при дропауте в районе величины 0,25, что является оптимальным значением (рис. 5).
При изменении соотношения тренировочных и тестовых данных практически отсутствует тренд для тренировочных данных, но присутствует небольшой растущий тренд для тестовых (рис. 6).
За счет колебаний значений вероятности наибольшее их сближение для тренировочных и тестовых данных наблюдается в районе значения 0,4. Анализ стандартных отклонений (рис. 7) позволяет заключить, что оптимальным диапазоном разбиения данных на выборки является интервал от 0,4 до 0,45, так как минимум неопределенности для тестовой выборки наблюдается именно на нем.
Подводя итог, следует отметить, что применение нейронных сетей в технической диагностике, и, в частности, фазохронометрии, имеет высокий потенциал, так как позволяет исключить человеческий фактор и повысить достоверность диагностики. Тем не менее, узкое место нейросетевого подхода заключается в необходимости иметь верифицированную многофакторную математическую модель диагностируемого объекта для корректной тренировки нейросети. Наличие математической модели нужно и при иных способах диагностики, но в случае с нейронными сетями этот аспект получает особую важность ввиду их большой чувствительности к тренировочным данным. Данная проблема может быть решена тренировкой на реальных дефектах реальных объектов, но в реальности это возможно далеко не всегда. Таким образом, только качественное математическое моделирование способно раскрыть весь потенциал нейронных сетей при технической диагностике.
Работа поддержана грантом Президента Российской Федерации для государственной поддержки молодых российских ученых – докторов наук МД-1209.2020.8. Отдельные результаты поддержаны в рамках государственного задания № 0705-2020-0046 в сфере научной деятельности.
Отдельные результаты работ получены с применением Центра коллективного пользования высокоточных измерительных технологий в области фотоники (ckp.vniiofi.ru), созданного на базе ФГУП «ВНИИОФИ».
Литература
1. Wiener N. Cybernetics or Control and Communication in the Animal and the Machine. 2nd ed. New York — London: The M.I.T. Press and John Wiley & Sons, Inc., 1961.
2. Голубев Ю. Ф. Нейросетевые методы в мехатронике. М.: Изд-во Моск. ун-та, 2007. 157 с.
3. Кацуба Ю. Н., Власова И.В. Применение искусственных нейронных сетей для диагностирования изделий // Международный научно-исследовательский журнал. 2015. № 3 (34) Ч. 1. С. 68–70. URL: https://research-journal.org/technical/primenenie-iskusstvennyx-nejronnyx-setej-dlya-diagnostirovaniya-izdelij/ (дата обращения: 17.05.2020).
4. Киселев М. И., Пронякин В. И. Фазовый метод исследования циклических машин и механизмов на основе хронометрического подхода // Измерительная техника. 2001. № 9. С. 15–18.
5. Keras: The Python Deep Learning Library [Электронный ресурс]. URL: www.keras.oi (дата обращения 20.02.2020)
6. TensorFlow: An end-to-end open source machine learning platform [Электронный ресурс]. URL: www.tensorflow.org (дата обращения 20.02.2020)
ПОТАПОВ Константин Геннадьевич –
кандидат технических наук, доцент МГТУ им. Н. Э. Баумана
КОМШИН Александр Сергеевич –
доктор технических наук, профессор МГТУ им. Н. Э. Баумана
СЫРИЦКИЙ Антони Борисович –
кандидат технических наук, доцент МГТУ им. Н. Э. Баумана
Искусственные нейронные сети (ИНС) в задачах диагностирования и прогнозирования технического состояния машин и механизмов могут быть использованы в качестве подсистемы выборки и принятия решений, передающей диагностическую информацию другим подсистемам управления [3].
Для решения задач диагностирования и прогнозирования необходимо сформировать базу с множеством состояний и произвести оценку степени влияния каждого информационного параметра на вероятность перехода машины или механизма в какое-либо из возможных состояний [3].
В рамках данного материала описывается опыт применения простейшего перцептрона к решению задачи технической диагностики фазохронометрическим методом (ФХМ) [4].
При ФХМ-диагностике единственным измеряемым параметром является время, а точнее вариации интервалов времени, которые проецируются по заданным алгоритмам на идеальный образец (или модель), после чего, на основании сравнения с ней, делается вывод о состоянии узла на момент измерения.
В качестве объекта исследования был выбран передний подшипниковый узел токарного станка 16К20Ф3. На указанном станке производились измерения для двух состояний переднего подшипника ‒ отрегулированное и ослабленное, на разных частотах холостого хода шпинделя ‒ 315 и 1000 об/мин. Полученные хронограммы вращения обрабатывались стандартными для метода способами, включающими в себя построение АКФ и ее спектра. С помощью математической модели обработанные данные были интерпретированы и сделаны верные выводы о состоянии подшипника. Перед нейронной сетью ставилась такая же задача, то есть задача правильной идентификации. Для этих целей, с помощью библиотек Keras [5] и TensorFlow [6] языка программирования Python, разработан однослойный перцептрон, схема которого показана на рис. 1.
Конфигурация перцептрона:
- тип модели ‒ последовательная;
- тип слоев ‒ полносвязные;
слои:
- входной – 625 нейронов, функция активации ‒ relu;
- выходной – два нейрона, функция активации ‒ softmax;
- входные данные ‒ массив данных с размерностью 625 значений;
- метрика ‒ точность;
- метод вычисления ошибки ‒ adam;
- функция потерь ‒ разреженная кросс-категориальная энтропия;
- случайное обнуление весов нейронной сети ‒ да, с вероятностью 25%;
- тип обучения ‒ с учителем.
Использование модели перцептрона в данном случае оправдано тем, что подобные нейронные сети хорошо справляются с задачами классификации. Непрерывный ряд интервалов времени, разбитый на отдельные циклы, можно представить как некий одномерный образ, индивидуальный для каждого состояния механизма или узла механизма. В этом плане данная задача близка к задаче идентификации изображений.
Необходимо отметить, что количество нейронов входного и выходного слоя было выбрано не случайным образом. Так как входной массив данных имеет 625 элементов, то логично было установить такое же количество нейронов входного слоя, и так как на данный момент стоит задача определения самого факта наличия дефекта ‒ без его классификации, то выходной слой имеет всего два нейрона – это 0 (нет дефекта) и 1 (есть дефект).
Входные данные для нейронной сети подготовлены следующим образом:
- массивы исходных данных поделены по циклам, где в каждом цикле 625 значений;
- каждому циклу внутри массива «нормальных» значений присвоена метка 0, а каждому циклу внутри массива «дефектных» значений присвоена метка 1;
- массивы объединены и перемешаны для получения репрезентативной выборки, что позволяет улучшить обучаемость нейронной сети;
- перемешанный единый массив поделен на тренировочный и тестовый массивы в соотношении 66 к 33%.
Обучение перцептрона производилось на 50 эпохах, при этом значения весовых коэффициентов, обеспечивающих наилучшую точность, сохранялись в файл.
В результате проведенных вычислений нейронная сеть продемонстрировала следующие результаты:
- для частоты вращения шпинделя 315 об/мин вероятность правильной идентификации как на тренировочных, так и на тестовых данных составила 97%;
- для частоты вращения шпинделя 1000 об/мин вероятность правильной идентификации на тренировочных данных составила 100%, а на тестовых – 99%.
Разница в вероятностях для 315 и 100 об/мин обусловлена тем, что результаты измерений для 315 об/мин сильнее зашумлены.
Далее изучено влияние отдельных параметров нейронной сети на вероятность верной идентификации. При построении графиков использовались данные, полученные путем многократных измерений с оценкой неопределенности вероятности верной идентификации:
При увеличении количества эпох происходит закономерный рост точности как на тренировочных, так и на проверочных данных (рис. 2). Вертикальными отрезками показаны доверительные интервалы для каждого значения эпохи при доверительной вероятности Р = 0,9973 и предположении о нормальности распределения. Хорошо видно, что при малом числе эпох вероятность правильной идентификации имеет существенную неопределенность, но уже после 25-ой эпохи неопределенность ощутимо уменьшается и достигает минимума к 30-ой эпохе (рис. 3), что является оптимальным числом для тренировки нейронной сети. Дальнейший рост количества эпох приводит к постепенному снижению вероятности верной идентификации на тестовой выборке и не сокращает неопределенность на ней.
При увеличении вероятности обнуления весовых коэффициентов, так называемом дропауте (метод регуляризации нейронной сети для предотвращения переобучения), вероятность правильной идентификации испытывает незначительные колебания в районе значения 0,95 для тестовой выборки и ощутимо падает для тренировочной при условии, что дропаут более 0,5 (рис. 4). Наименьшая неопределенность на тестовой выборке достигается при дропауте в районе величины 0,25, что является оптимальным значением (рис. 5).
При изменении соотношения тренировочных и тестовых данных практически отсутствует тренд для тренировочных данных, но присутствует небольшой растущий тренд для тестовых (рис. 6).
За счет колебаний значений вероятности наибольшее их сближение для тренировочных и тестовых данных наблюдается в районе значения 0,4. Анализ стандартных отклонений (рис. 7) позволяет заключить, что оптимальным диапазоном разбиения данных на выборки является интервал от 0,4 до 0,45, так как минимум неопределенности для тестовой выборки наблюдается именно на нем.
Подводя итог, следует отметить, что применение нейронных сетей в технической диагностике, и, в частности, фазохронометрии, имеет высокий потенциал, так как позволяет исключить человеческий фактор и повысить достоверность диагностики. Тем не менее, узкое место нейросетевого подхода заключается в необходимости иметь верифицированную многофакторную математическую модель диагностируемого объекта для корректной тренировки нейросети. Наличие математической модели нужно и при иных способах диагностики, но в случае с нейронными сетями этот аспект получает особую важность ввиду их большой чувствительности к тренировочным данным. Данная проблема может быть решена тренировкой на реальных дефектах реальных объектов, но в реальности это возможно далеко не всегда. Таким образом, только качественное математическое моделирование способно раскрыть весь потенциал нейронных сетей при технической диагностике.
Работа поддержана грантом Президента Российской Федерации для государственной поддержки молодых российских ученых – докторов наук МД-1209.2020.8. Отдельные результаты поддержаны в рамках государственного задания № 0705-2020-0046 в сфере научной деятельности.
Отдельные результаты работ получены с применением Центра коллективного пользования высокоточных измерительных технологий в области фотоники (ckp.vniiofi.ru), созданного на базе ФГУП «ВНИИОФИ».
Литература
1. Wiener N. Cybernetics or Control and Communication in the Animal and the Machine. 2nd ed. New York — London: The M.I.T. Press and John Wiley & Sons, Inc., 1961.
2. Голубев Ю. Ф. Нейросетевые методы в мехатронике. М.: Изд-во Моск. ун-та, 2007. 157 с.
3. Кацуба Ю. Н., Власова И.В. Применение искусственных нейронных сетей для диагностирования изделий // Международный научно-исследовательский журнал. 2015. № 3 (34) Ч. 1. С. 68–70. URL: https://research-journal.org/technical/primenenie-iskusstvennyx-nejronnyx-setej-dlya-diagnostirovaniya-izdelij/ (дата обращения: 17.05.2020).
4. Киселев М. И., Пронякин В. И. Фазовый метод исследования циклических машин и механизмов на основе хронометрического подхода // Измерительная техника. 2001. № 9. С. 15–18.
5. Keras: The Python Deep Learning Library [Электронный ресурс]. URL: www.keras.oi (дата обращения 20.02.2020)
6. TensorFlow: An end-to-end open source machine learning platform [Электронный ресурс]. URL: www.tensorflow.org (дата обращения 20.02.2020)
ПОТАПОВ Константин Геннадьевич –
кандидат технических наук, доцент МГТУ им. Н. Э. Баумана
КОМШИН Александр Сергеевич –
доктор технических наук, профессор МГТУ им. Н. Э. Баумана
СЫРИЦКИЙ Антони Борисович –
кандидат технических наук, доцент МГТУ им. Н. Э. Баумана
Отзывы читателей