Jak sztuczna inteligencja wykrywa anomalie?

Wykrywanie anomalii to cichy bohater operacji na danych – czujnik dymu, który uruchamia się, zanim coś się zapali.

Mówiąc wprost: sztuczna inteligencja uczy się, jak wygląda „w miarę normalny”, przypisuje nowym zdarzeniom wynik anomalii , a następnie decyduje, czy wysłać wiadomość do człowieka (lub automatycznie zablokować zdarzenie) na podstawie progu . Diabeł tkwi w tym, jak zdefiniujesz „w miarę normalny”, skoro Twoje dane są sezonowe, chaotyczne, zmienne i czasami kłamliwe. [1]

Artykuły, które mogą Ci się spodobać po przeczytaniu tego:

🔗 Dlaczego sztuczna inteligencja może być szkodliwa dla społeczeństwa
Analizuje zagrożenia etyczne, ekonomiczne i społeczne związane z powszechnym wdrażaniem sztucznej inteligencji.

🔗 Ile wody faktycznie zużywają systemy AI
Wyjaśnia kwestie chłodzenia centrów danych, zapotrzebowania na szkolenia i wpływu wody na środowisko.

🔗 Czym jest zbiór danych AI i dlaczego jest ważny?
Definiuje zbiory danych, etykietowanie, źródła i ich rolę w wydajności modelu.

🔗 W jaki sposób sztuczna inteligencja przewiduje trendy na podstawie złożonych danych
Obejmuje rozpoznawanie wzorców, modele uczenia maszynowego i zastosowania prognozowania w świecie rzeczywistym.

„Jak sztuczna inteligencja wykrywa anomalie?”

Dobra odpowiedź powinna oferować więcej niż tylko listę algorytmów. Powinna wyjaśniać mechanizmy i to, jak wyglądają po zastosowaniu do rzeczywistych, niedoskonałych danych. Najlepsze wyjaśnienia:

Przedstaw podstawowe składniki: cechy , linie bazowe , wyniki i progi . [1]
Porównaj rodziny praktyczne: odległość, gęstość, jedna klasa, izolacja, probabilistyka, rekonstrukcja. [1]
Radzenie sobie z dziwactwami szeregów czasowych: „normalność” zależy od pory dnia, dnia tygodnia, wydań i świąt. [1]
Traktuj ocenę jak prawdziwe ograniczenie: fałszywe alarmy nie tylko irytują, ale także niszczą zaufanie. [4]
Należy uwzględnić interpretowalność i udział człowieka w procesie, ponieważ „to dziwne” nie jest przyczyną główną. [5]

Podstawy mechaniki: wartości bazowe, wyniki, progi 🧠

Większość systemów anomalii – skomplikowanych czy nie – sprowadza się do trzech ruchomych części:

widzi model )

Surowe sygnały rzadko wystarczają. Albo projektujesz cechy (statystyki kroczące, proporcje, opóźnienia, delty sezonowe), albo uczysz się reprezentacji (osadzeń, podprzestrzeni, rekonstrukcji). [1]

2) Punktacja (czyli: jak „dziwne” to jest?)

Do popularnych pomysłów na punktację należą:

Oparte na odległości : daleko od sąsiadów = podejrzane. [1]
Oparte na gęstości : niska gęstość lokalna = podejrzane (LOF jest przykładem). [1]
Granice jednej klasy : naucz się „normy”, sygnalizuj to, co wykracza poza nią. [1]
Probabilistyczny : niskie prawdopodobieństwo w ramach dopasowanego modelu = podejrzany. [1]
Błąd rekonstrukcji : jeśli model wytrenowany w trybie normalnym nie może go odbudować, prawdopodobnie jest uszkodzony. [1]

3) Próg (czyli kiedy zadzwonić dzwonkiem)

Progi mogą być stałe, oparte na kwantylach, na segment lub zależne od kosztów – ale powinny być kalibrowane w oparciu o budżety alertów i koszty dalszego przetwarzania, a nie wibracje. [4]

Jeden bardzo praktyczny szczegół: detektory wartości odstających/nowości pakietu scikit-learn ujawniają surowe wyniki , a następnie stosują próg (często kontrolowany za pomocą założenia o zanieczyszczeniu), aby przekształcić wyniki w decyzje dotyczące wartości odstających/nieodstających. [2]

Szybkie definicje, które zapobiegają bólowi w przyszłości 🧯

Dwa rozróżnienia, które uchronią Cię przed subtelnymi błędami:

Wykrywanie wartości odstających : Twoje dane treningowe mogą już zawierać wartości odstające. Algorytm w każdym razie próbuje modelować „gęsty obszar normalny”.
Wykrywanie nowości : zakłada się, że dane treningowe są czyste; oceniasz, czy nowe obserwacje pasują do wyuczonego wzorca normalnego. [2]

Ponadto: wykrywanie nowości jest często definiowane jako klasyfikacja jednoklasowa – modelowanie normalności, ponieważ przykłady nietypowe są rzadkie lub niezdefiniowane. [1]

Nienadzorowane konie robocze, których naprawdę użyjesz 🧰

Gdy etykiet jest mało (co w zasadzie zawsze ma miejsce), w rzeczywistych procesach pojawiają się następujące narzędzia:

Las izolacyjny : silne domyślne ustawienie w wielu przypadkach tabelarycznych, szeroko stosowane w praktyce i zaimplementowane w scikit-learn. [2]
Jednoklasowy SVM : może być skuteczny, ale jest wrażliwy na dostrajanie i założenia; scikit-learn wyraźnie wskazuje na potrzebę ostrożnego dostrajania hiperparametrów. [2]
Lokalny współczynnik odstający (LOF) : klasyczny system punktacji oparty na gęstości; świetnie sprawdza się, gdy „normalność” nie jest jednorodną plamą. [1]

Praktyczna pułapka, którą zespoły odkrywają na nowo co tydzień: LOF zachowuje się inaczej w zależności od tego, czy wykonuje się wykrywanie wartości odstających na zestawie treningowym, czy wykrywanie nowości na nowych danych — scikit-learn wymaga nawet, novelty=True było bezpiecznie przyznawane za niewidziane punkty. [2]

Solidna baza, która nadal działa, gdy dane są niestabilne 🪓

Jeśli myślisz sobie: „potrzebujemy czegoś, co nie będzie nas pogrążać w zapomnienie”, to rzetelne statystyki są niedoceniane.

Zmodyfikowany wynik z wykorzystuje medianę i MAD (medianę odchylenia bezwzględnego) w celu zmniejszenia wrażliwości na wartości ekstremalne. Podręcznik EDA NIST dokumentuje zmodyfikowany wynik z i wskazuje na powszechnie stosowaną regułę „potencjalnej wartości odstającej” dla wartości bezwzględnej powyżej 3,5 . [3]

Nie rozwiąże to każdego problemu anomalii, ale często stanowi solidną pierwszą linię obrony, zwłaszcza w przypadku zakłóconych metryk i monitorowania na wczesnym etapie. [3]

Szeregi czasowe rzeczywistości: „Normalność” zależy od tego, kiedy ⏱️📈

Anomalie szeregów czasowych są trudne, ponieważ kontekst jest kluczowy: można się spodziewać skoku w południe; ten sam skok o 3 nad ranem może oznaczać, że coś się pali. Wiele praktycznych systemów modeluje zatem normalność, wykorzystując cechy zależne od czasu (opóźnienia, delty sezonowe, okna ruchome) i ocenia odchylenia od oczekiwanego wzorca. [1]

Jeśli pamiętasz tylko jedną zasadę: segmentuj swoją bazę (godzina/dzień/region/poziom usługi), zanim uznasz połowę swojego ruchu za „anomalny”. [1]

Ocena: Pułapka rzadkich zdarzeń 🧪

Wykrywanie anomalii to często „szukanie igły w stogu siana”, co sprawia, że ocena jest dziwna:

Krzywe ROC mogą wydawać się pozornie dobre, gdy wartości dodatnie występują rzadko.
Widoki precyzyjnego przypominania są często bardziej informacyjne w przypadku ustawień niezrównoważonych, ponieważ skupiają się na wydajności klasy pozytywnej. [4]
Z operacyjnego punktu widzenia potrzebny jest również budżet alertów : ile alertów na godzinę ludzie są w stanie faktycznie przekazać, nie poddając się wściekłością? [4]

Backtesting w ramach przesuwających się okien pozwala wykryć klasyczny tryb awarii: „działa pięknie… na dystrybucji z zeszłego miesiąca”. [1]

Interpretowalność i przyczyna źródłowa: pokaż swoją pracę 🪄

Alarmowanie bez wyjaśnienia jest jak otrzymanie tajemniczej pocztówki. Trochę przydatne, ale frustrujące.

Narzędzia interpretowalności mogą pomóc, wskazując, które cechy miały największy wpływ na wynik anomalii, lub podając wyjaśnienia w stylu „co musiałoby się zmienić, aby to wyglądało normalnie?”. „Interpretable Machine Learning ” to solidny, krytyczny przewodnik po popularnych metodach (w tym atrybucjach w stylu SHAP) i ich ograniczeniach. [5]

Celem nie jest tylko wygoda interesariuszy, ale także szybsza segregacja i mniejsza liczba powtarzających się incydentów.

Wdrożenie, dryfowanie i pętle sprzężenia zwrotnego 🚀

Modelki nie żyją w slajdach. Żyją w rurociągach.

Typowa historia dotycząca „pierwszego miesiąca produkcji”: detektor głównie sygnalizuje wdrożenia, zadania wsadowe i brakujące dane… co nadal jest przydatne, ponieważ zmusza do oddzielenia „incydentów dotyczących jakości danych” od „anomalii biznesowych”.

W rzeczywistości:

Monitoruj dryf i dokonuj ponownego szkolenia/kalibracji w miarę zmian zachowania. [1]
Rejestruj dane wejściowe wyników + wersję modelu , aby móc odtworzyć przyczynę podziału czegoś na strony. [5]
Rejestruj opinie ludzkie (przydatne i zakłócające alerty), aby na przestrzeni czasu dostrajać progi i segmenty. [4]

Kąt bezpieczeństwa: IDS i analiza behawioralna 🛡️

Zespoły ds. bezpieczeństwa często łączą koncepcje anomalii z detekcją opartą na regułach: punkty odniesienia dla „normalnego zachowania hosta” oraz sygnatury i zasady dla znanych nieprawidłowych wzorców. Dokument NIST SP 800-94 (wersja ostateczna) pozostaje powszechnie cytowanym dokumentem ramowym dla rozważań dotyczących systemów wykrywania i zapobiegania włamaniom; zauważa on również, że projekt „Rev. 1” z 2012 r. nigdy nie stał się ostateczny i został później wycofany. [3]

Tłumaczenie: stosuj ML tam, gdzie to pomaga, ale nie wyrzucaj nudnych zasad – są nudne, bo działają.

Tabela porównawcza: popularne metody w skrócie 📊

Narzędzie / Metoda	Najlepsze dla	Dlaczego to działa (w praktyce)
Solidne / zmodyfikowane wyniki z	Proste wskaźniki, szybkie dane bazowe	Mocne pierwsze przejście, gdy potrzebujesz „wystarczająco dobrego” wyniku i mniejszej liczby fałszywych alarmów. [3]
Las Izolacji	Tabularne, mieszane cechy	Solidna domyślna implementacja i szerokie zastosowanie w praktyce. [2]
Jednoklasowa SVM	Kompaktowe regiony „normalne”	Wykrywanie nowości na podstawie granic; dostrajanie ma duże znaczenie. [2]
Lokalny współczynnik odstający	Normalne w rodzaju rozmaitości	Kontrast gęstości w porównaniu z sąsiadami ukazuje lokalną dziwność. [1]
Błąd rekonstrukcji (np. w stylu autokodera)	Wzory wielowymiarowe	Trenuj na normalnym poziomie; duże błędy rekonstrukcji mogą sygnalizować odchylenia. [1]

Oszustwo: zacznij od solidnych linii bazowych + nudnej, nienadzorowanej metody, a następnie dodawaj złożoność tylko tam, gdzie się to opłaca.

Mini podręcznik: Od zera do alertów 🧭

Zdefiniuj „dziwność” operacyjnie (opóźnienie, ryzyko oszustwa, obciążenie procesora, ryzyko inwentaryzacyjne).
Zacznij od poziomu bazowego (solidnych statystyk lub segmentowanych progów). [3]
Wybierz jeden nienadzorowany model jako pierwsze przejście (las izolacyjny / LOF / jednoklasowa SVM). [2]
Ustal progi za pomocą budżetu alertowego i oceń, stosując podejście PR, jeśli pozytywy zdarzają się rzadko. [4]
Dodaj wyjaśnienia i rejestrowanie , aby każdy alert był możliwy do odtworzenia i debugowania. [5]
Przeprowadź testy wsteczne, wyślij, naucz się, ponownie skalibruj – dryft jest normalny. [1]

Zdecydowanie możesz to zrobić w tydzień… zakładając, że Twoje znaczniki czasu nie są połączone taśmą klejącą i nadzieją. 😅

Uwagi końcowe – za długie, nie przeczytałem🧾

Sztuczna inteligencja wykrywa anomalie, ucząc się praktycznego obrazu „normy”, oceniając odchylenia i sygnalizując przekroczenia progu. Najlepsze systemy wygrywają nie dzięki efektowności, ale dzięki kalibracji : segmentowanym punktom bazowym, budżetom alertów, interpretowalnym wynikom i pętli sprzężenia zwrotnego, która przekształca zakłócone alarmy w wiarygodny sygnał. [1]

Odniesienia

Pimentel i in. (2014) – Przegląd metod wykrywania nowości (PDF, Uniwersytet Oksfordzki) czytaj więcej
Dokumentacja scikit-learn — wykrywanie nowości i wartości odstających czytaj więcej
Podręcznik elektroniczny NIST/SEMATECH – Wykrywanie wartości odstających przeczytaj więcej i NIST CSRC – SP 800-94 (wersja ostateczna): Przewodnik po systemach wykrywania i zapobiegania włamaniom (IDPS) przeczytaj więcej
Saito i Rehmsmeier (2015) – Wykres precyzji-współczynnika odwrotności jest bardziej informatywny niż wykres ROC podczas oceny klasyfikatorów binarnych w niezrównoważonych zbiorach danych (PLOS ONE) czytaj więcej
Molnar - Interpretable Machine Learning (książka internetowa) czytaj więcej

Znajdź najnowszą sztuczną inteligencję w oficjalnym sklepie z asystentami AI

O nas

Powrót do bloga

Kraj/region