Page 37 - ИССЛЕДОВАНИЯ И ИННОВАЦИИ СИНЕРГИЯ ЗНАНИЙ И ПРАКТИКИ ч2
P. 37
«Исследования и инновации: синергия знаний и практики»
Метод классификации обучает модель классифицировать
объекты на основе их признаков. Модель может быть обучена
разделять данные на нормальные и аномальные значения, что
позволяет выявлять аномалии при классификации новых данных.
Кластеризация - это задача машинного обучения,
заключающаяся в разделении набора данных на группы, называемые
кластерами. Цель кластеризации - создать кластеры, которые будут как
можно более однородными внутри и как можно более разнородными
между собой. Методы машинного обучения используют алгоритмы,
такие как метод k-средних и иерархическая кластеризация для
определения кластеров [1].
Статистические методы используют математические модели
и статистические инструменты для выявления аномалий в данных. Они
анализируют отклонения данных от стандартных шаблонов или
распределений, позволяя определить необычные или неожиданные
события. Методы могут использовать сравнение значений параметров
системы с их ожидаемыми значениями или тесты на нормальность
данных. Однако, статистические методы могут быть неэффективны
при сложных аномалиях или данных, не соответствующих ожидаемым
распределениям. Важно выбирать метод в зависимости от специфики
данных и применять их с учетом особенностей системы.
Статистические методы для выявления аномалий в технических
системах делятся на две категории: методы, основанные на сравнении,
и методы, основанные на моделировании. Методы сравнения
сравнивают значения параметров с ожидаемыми, выявляя
значительные отклонения как аномалии.
Методы, основанные на моделировании, используют
статистические модели для прогнозирования будущих значений
параметров системы. Они могут быть основаны на моделях временных
рядов, таких как линейная регрессия, экспоненциальное сглаживание
и авторегрессионные модели.
37