Sztuczna inteligencja w komunikatorach: jak działają nowe filtry antyphishingowe

0
15
2.5/5 - (2 votes)

Nawigacja:

Dlaczego komunikatory stały się celem numer jeden dla phishingu

Od skrzynki e‑mail do okna czatu – zmiana frontu ataku

Phishing kojarzył się przez lata niemal wyłącznie z e‑mailami. Tymczasem większość codziennych rozmów przeniosła się do komunikatorów: WhatsApp, Messenger, Signal, Telegram, Teams, Slack i dziesiątek mniejszych aplikacji. Oszuści podążają tam, gdzie jest uwaga użytkowników. Skoro powiadomienia z komunikatorów widzisz natychmiast, to właśnie tam łatwiej wymusić szybkie, nieprzemyślane działanie.

Komunikatory dają też oszustom coś jeszcze: wrażenie „prywatnej rozmowy”. Krótkie wiadomości, iconki, skróty – to wszystko obniża czujność. W e‑mailu użytkownicy przywykli już do ostrzeżeń, filtrów spamowych i klasycznych sygnałów alarmowych. W czacie wiadomość „od kuriera” lub „od szefa” wygląda po prostu jak kolejny komunikat w długiej liście powiadomień.

Do tego dochodzi tempo komunikacji. Kiedy rozmawiasz w wątku służbowym na Slacku czy Teamsach, liczysz minuty. Nikt nie chce być „wąskim gardłem”, więc reagujesz szybko. To dokładnie ta przestrzeń, w której phishing w komunikatorach ma największą skuteczność – atak liczy na odruchowe kliknięcie lub przekazanie danych, zanim włączy się zdrowy rozsądek.

Krótkie formaty, skracacze linków i emotikony jako osłona

W e‑mailu długi, podejrzany link od razu rzuca się w oczy. W komunikatorach królują skracacze URL, podglądy kart i wiadomości typu „kliknij tu”. Link przychodzi jako podgląd strony z atrakcyjną miniaturą lub skrócony adres, którego nikt nie rozwija ręcznie przed kliknięciem. Dla filtra opartego na prostych regułach to koszmar – z samego tekstu często niewiele da się wyczytać.

Krótka forma wiadomości działa też na naszą psychikę. Gdy ktoś pisze: „Hej, możesz mi szybko wysłać kod z SMS-a? Zablokowali mi konto”, w komunikatorze brzmi to jak zwykła prośba. Zwłaszcza gdy obok pojawia się emotka „🙄” lub „😓”, która wywołuje empatię. W klasycznym filtrze antyphishingowym nie ma miejsca na analizę tonu czy emocji, w przeciwieństwie do nowych rozwiązań opartych na sztucznej inteligencji.

Do tego dochodzą multimedia. Coraz więcej oszustw w komunikatorach wykorzystuje obraz: zrzuty ekranu fałszywych paneli logowania, zdjęcia „kurierów”, grafiki z logo banków. Tradycyjne filtry, nastawione na tekst i domeny, przegrywają w starciu z wizualnym phishingiem, który dopiero systemy AI potrafią wstępnie interpretować.

Najpopularniejsze scenariusze ataków w komunikatorach

Scenariusze phishingu w komunikatorach są proste, ale od lat skuteczne – szczególnie wtedy, gdy pojawiają się w „zaufanym” medium rozmowy.

  • „Na kuriera” – wiadomość o dopłacie kilku złotych do przesyłki, z linkiem do fałszywej bramki płatności. Często wygląda jak komunikat z firmy kurierskiej, z logo w podglądzie linku.
  • „Na szefa” – osoba podszywająca się pod przełożonego pisze na komunikatorze służbowym lub prywatnym: „Jestem na spotkaniu, nie mogę gadać, zrób pilny przelew i wyślij mi potwierdzenie tutaj”. Elementem nacisku jest czas i powołanie się na autorytet.
  • „Na dziecko” lub „na bliską osobę” – prośba o szybki przelew, bo „Telefon mi się zepsuł, piszę z tymczasowego numeru”, często z prośbą o niekontaktowanie się przez inne kanały, bo „jestem na lekcji / w pracy”.
  • „Na inwestycje” – wiadomości zachęcające do „wejścia w okazję”, z linkiem do panelu inwestycyjnego lub pseudo‑kryptowalut, często podszywające się pod znane marki lub celebrytów.

Każdy z tych schematów da się opisać zestawem cech: nagłość, presja czasu, prośba o pieniądze lub dane, odwołanie do autorytetu lub emocji. Właśnie te cechy starają się wychwycić nowe filtry antyphishingowe w komunikatorach, działające w oparciu o sztuczną inteligencję.

Krótki przykład z życia: „Pilny przelew” na komunikatorze firmowym

Wyobraź sobie pracownika działu finansów, który późnym popołudniem dostaje wiadomość na firmowym komunikatorze (np. Teams lub Slack): „Cześć, potrzebuję pilnie wykonania przelewu do nowego kontrahenta, musimy to zamknąć dziś. Nie mogę gadać, siedzę na callu, zrobisz to od ręki? Dane w załączniku.” Wiadomość podpisana jest imieniem i nazwiskiem dyrektora finansowego, a avatar wygląda znajomo.

W natłoku zadań taka prośba nie wydaje się niezwykła. Pracownik pobiera załącznik, otwiera plik z danymi rachunku. Jeśli organizacja korzysta wyłącznie ze starych filtrów, nikt nie wychwyci, że podobna prośba nigdy wcześniej nie pojawiła się w tym wątku, a styl wiadomości różni się od zwyczajowego tonu dyrektora. W efekcie przelew jest wykonany, pieniądze trafiają do oszusta.

Nowe filtry AI analizują nie tylko adres nadawcy, ale również:
– nietypową prośbę o przelew w tym kontekście,
– brak wcześniejszej historii rozmów o finansach z tym pracownikiem,
– nerwowy, skrócony język i presję czasu,
– fakt, że wiadomość pochodzi z nietypowego urządzenia lub lokalizacji.
To wystarcza, by oznaczyć komunikat jako podejrzany, dołączyć ostrzeżenie lub nawet tymczasowo zablokować załącznik.

„Ja zawsze sprawdzam linki” – dlaczego to za mało

Wielu użytkowników jest przekonanych, że umie rozpoznać phishing. Sprawdza domeny, patrzy na literówki, szuka błędów językowych. W komunikatorach te zasady zawodzą, bo oszuści wykorzystują skracacze, ataki QR‑code, obrazki zamiast tekstu i socjotechnikę. Coraz częściej linki prowadzą do stron, które dynamicznie zmieniają treść, a same domeny są młode, jeszcze nieznane żadnym czarnym listom.

Nawet osoba technicznie świadoma jest w stanie popełnić błąd, gdy dostaje taką wiadomość w biegu: w tramwaju, w kolejce, między spotkaniami. Dodatkową trudnością jest to, że komunikatory często zasłaniają pełny link, pokazując tylko jego skróconą wersję lub tytuł strony. Człowiek jest więc skazany na zaufanie do mechanizmów aplikacji – albo do filtrów antyphishingowych, które działają w tle.

Nowe systemy oparte na sztucznej inteligencji nie zastąpią zdrowego rozsądku, ale są w stanie wyłapać sygnały, których pojedynczy użytkownik nie ma szans samodzielnie zauważyć: podobieństwo treści do tysięcy wcześniejszych ataków, nietypowe schematy zachowań, wewnętrzne sprzeczności w wiadomości. Wraz z rosnącą złożonością phishingu w komunikatorach to już nie „dodatek”, lecz realna druga linia obrony.

Jak klasyczne filtry antyphishingowe przestały wystarczać

Stare podejście: czarne listy, sygnatury i proste reguły

Klasyczne filtry antyphishingowe wyrosły z filtrów antyspamowych. Opierały się na kilku podstawowych pomysłach:

  • Czarne listy domen i adresów – jeśli dana domena lub IP zostały zgłoszone jako źródło phishingu, kolejne wiadomości z tego źródła były blokowane lub oznaczane jako niebezpieczne.
  • Sygnatury ataków – konkretne wzorce treści, kodu strony czy załączników zapisywano jako „sygnaturę”. Gdy filtr wykrywał je ponownie, podnosił alarm.
  • Reguły słów kluczowych – zdefiniowane frazy, takie jak „zweryfikuj swoje konto”, „pilne logowanie”, „zresetuj hasło”, podnosiły poziom ryzyka wiadomości.

Takie podejście działało jeszcze w czasach, gdy phishing był stosunkowo prymitywny. Atakujący masowo wysyłali podobne wiadomości z tych samych serwerów, używali powtarzalnych szablonów. Filtry mogły wtedy „zapamiętać” znane złośliwe wzorce i szybko reagować na ich kolejne wystąpienia.

W komunikatorach ten model zaczął się jednak sypać. Ataki są dziś krótkie, zindywidualizowane, prowadzone z przejętych kont realnych osób lub świeżo założonych profili. Zdarza się, że cała kampania phishingowa opiera się na wymianie zaledwie kilku wiadomości na osobę – za mało, by klasyczne sygnatury miały z czym pracować.

Dlaczego proste filtry gubią się w czatach

Komunikatory są mniej ustrukturyzowane niż e‑mail. Część wiadomości to wyłącznie emotikony, GIF‑y, krótkie „ok”. Wiele dialogów opiera się na skrótach, slangu, mieszaniu języków. Filtr oparty tylko na słowach kluczowych w takim środowisku jest ślepy na kontekst. Prośba „wyślij mi kod” może być zupełnie niewinna, jeśli rozmowa dotyczy wspólnej konfiguracji aplikacji, a skrajnie podejrzana, gdy pojawia się znienacka od dawno nieaktywnego kontaktu.

Do tego dochodzi ogromna liczba kanałów i wątków. W firmowych komunikatorach pracownicy funkcjonują równocześnie w kilku, kilkunastu przestrzeniach: projektach, kanałach ogólnych, prywatnych wiadomościach. Stare filtry patrzą na każdą wiadomość osobno, nie próbując rozumieć, w jakim kontekście się pojawia. Nie widzą, że w danym wątku nigdy wcześniej nie było mowy o pieniądzach ani że styl pisania rzekomego „szefa” w tym kanale zawsze był inny.

W komunikatorach używa się też ogromnej ilości multimediów. Obrazki z kodami QR, zrzuty ekranu paneli logowania czy fałszywych powiadomień systemowych są trudne do parsowania dla klasycznych filtrów. Tymczasem właśnie w nich kryje się często sedno ataku – użytkownik nie musi nawet klikać w link, wystarczy, że przepisze dane z ekranu.

Kreatywność oszustów kontra statyczne sygnatury

Oszustwa w komunikatorach korzystają z dynamicznych technik, które omijają statyczne listy i sygnatury:

  • Linki jednorazowe – adresy URL generowane indywidualnie dla ofiary, czasem z krótkim okresem ważności. Po zakończeniu kampanii domena może zostać wyczyszczona lub przestać odpowiadać.
  • Dynamiczne strony phishingowe – mechanizmy wykrywające automaty skanujące (roboty filtrów) i w takim przypadku wyświetlające nieszkodliwą treść, podczas gdy realny użytkownik widzi panel wyłudzania danych.
  • Podszywanie się pod znane marki – perfekcyjnie odwzorowane logotypy, kolory, elementy interfejsu, a nawet poprawny język i lokalne szczegóły. Klasyczny filtr bazujący na słowach kluczowych jest w takiej sytuacji bezradny.

Oszuści eksperymentują też z formatowaniem. Część z nich wysyła treści jako obrazy z tekstem, co utrudnia prostą analizę. Inni stosują mieszankę języków lub wstawiają znaki specjalne do słów, by ominąć reguły (np. „z@loguj.się” zamiast „zaloguj się”). Bez mechanizmów rozpoznawania wzorców na wyższym poziomie trudno jest skutecznie takie wiadomości wychwycić.

Fałszywe alarmy i zmęczenie ostrzeżeniami

Jednym z największych problemów tradycyjnych filtrów w komunikatorach jest liczba fałszywych alarmów. Jeśli każde hasło „pilne”, „ważne” czy „przelew” wywołuje ostrzeżenie, użytkownicy zaczynają je ignorować. Po kilku dniach okienka z groźnie brzmiącymi komunikatami klikane są odruchowo w stylu „dalej, dalej, zamknij”.

To zjawisko, nazywane czasem „zmęczeniem ostrzeżeniami”, w praktyce obniża poziom bezpieczeństwa. Lepiej mieć mniej alertów, ale bardziej precyzyjnych, niż zalewać użytkownika serią komunikatów, z których 90% okazuje się nieistotna. Stare filtry nie potrafią dobrze ocenić kontekstu, więc chętnie „dmuchają na zimne”, co kończy się utratą zaufania.

Producenci komunikatorów widzą ten problem bardzo wyraźnie. Dlatego coraz częściej inwestują w filtry antyphishingowe oparte na sztucznej inteligencji, które mogą lepiej rozumieć treść i zachowanie użytkowników, a nie tylko suche słowa i adresy URL. Zamiast doklejać kolejne reguły, których i tak nikt nie będzie w stanie ręcznie utrzymywać, przenoszą ciężar na modele uczące się na ogromnych zbiorach realnych danych.

Osoba korzystająca z aplikacji czatu AI na smartfonie
Źródło: Pexels | Autor: Abdelrahman Ahmed

Czym właściwie są „filtry antyphishingowe oparte na AI”

Uczenie maszynowe, modele językowe i analiza zachowań w prostych słowach

Gdy mowa o filtrach antyphishingowych w komunikatorach, „sztuczna inteligencja” oznacza zazwyczaj trzy grupy technik:

  • Uczenie maszynowe (machine learning) – system uczy się na setkach tysięcy przykładów, które wiadomości były phishingiem, a które nie. Na tej podstawie rozpoznaje wzorce, których programista nie zdefiniował ręcznie.
  • Modele językowe (NLP, LLM) – algorytmy analizujące treść wiadomości, ton wypowiedzi, zależności między słowami. Umożliwiają ocenę tego, czy komunikat brzmi jak próba manipulacji, nawet jeśli nie zawiera oczywistych słów-kluczy.
  • Analiza zachowań (behavioral analytics)

    Oprócz samej treści wiadomości filtry oparte na AI przyglądają się temu, jak komunikujemy się na co dzień. Dla wielu osób brzmi to groźnie, ale w praktyce chodzi o statystykę, a nie o czytanie prywatnych rozmów słowo w słowo.

    Systemy śledzą anonimowe wzorce: o jakich porach zwykle piszesz, z kim najczęściej, jak długie są wiadomości, jak często pojawiają się załączniki czy linki. Gdy coś drastycznie odbiega od normy – np. konto spokojnego specjalisty nagle wysyła w nocy dziesiątki pilnych próśb o przelew – filtr podnosi poziom ryzyka.

    Takie podejście pomaga zwłaszcza przy atakach z przejętych kont. Wiadomość może wyglądać całkowicie poprawnie językowo, domena linku nie pojawia się jeszcze na czarnych listach, a jednak zachowanie nadawcy jest nienaturalne. Prosty przykład: przejęte konto HR zaczyna nagle prosić współpracowników o przesłanie kodów do logowania na „nową platformę płacową”. Analiza treści może dać wynik „może być”, ale analiza zachowania – „to konto nigdy nie wysyłało takich próśb, i to w dodatku do przypadkowych osób z innych działów”.

    Takie sygnały nie działają w izolacji. Dopiero połączenie ich z treścią wiadomości, historią rozmów w danym wątku i informacjami o urządzeniu tworzy pełniejszy obraz ryzyka.

    Modele specjalistyczne, a nie „magiczna” AI do wszystkiego

    Wiele osób wyobraża sobie filtr antyphishingowy jako jedną, wszechmocną „sztuczną inteligencję”. W praktyce producenci komunikatorów korzystają z kilku wyspecjalizowanych modeli, z których każdy jest dobry w czymś innym:

  • Model klasyfikacji treści – ocenia, czy wiadomość przypomina znane ataki (np. prośby o kody SMS, linki do płatności, fałszywe logowania).
  • Model analizy linków – bada strukturę adresu URL, reputację domeny, ewentualne przekierowania, a także to, jak strona reaguje na różne rodzaje odwiedzających.
  • Model analizy stylu pisania – porównuje sposób formułowania zdań z dotychczasową historią konta (np. długość zdań, używane zwroty, emotikony), żeby wykryć przejęcie profilu.
  • Model oceny ryzyka zachowania – patrzy na nietypowe wzorce logowań, lokalizacji, urządzeń oraz nagłe zmiany sposobu korzystania z komunikatora.

Poszczególne modele nie podejmują decyzji samodzielnie. Ich wyniki trafiają do warstwy „orkiestracji”, która składa wszystko w jedną ocenę ryzyka. Dzięki temu pojedyncza dziwna rzecz (np. nietypowa lokalizacja, gdy naprawdę jesteś w delegacji) nie musi od razu skutkować blokadą. Problem pojawia się dopiero, gdy „dziwnych” elementów jest kilka naraz.

Jak AI skanuje wiadomości w komunikatorach – krok po kroku

Krok 1: Wstępne filtrowanie i anonimizacja

Gdy wysyłasz lub odbierasz wiadomość, nie trafia ona od razu „na stół” dużego modelu językowego. Najpierw przechodzi przez prostsze, szybkie filtry, które wykonują kilka podstawowych zadań:

  • wyodrębniają potencjalnie wrażliwe elementy – linki, numery telefonów, adresy e‑mail, wzorce przypominające kody jednorazowe czy numery kart,
  • sprawdzają reputację domeny – czy była już widziana w innych komunikatorach, czy pojawia się w zgłoszeniach użytkowników,
  • nakładają w miarę możliwości anonimizację – np. skracają identyfikatory transakcji czy numery kont, jeśli nie są kluczowe dla analizy phishingu.

Na tym etapie odfiltrowana zostaje ogromna liczba zupełnie zwyczajnych wiadomości („będę za 5 min”, „ok, dzięki”) bez konieczności angażowania droższych obliczeniowo modeli AI. Do dalszego etapu trafiają głównie te treści, które zawierają elementy typowe dla potencjalnych ataków: link, prośbę o kod, dane logowania, odnośnik do płatności.

Krok 2: Analiza treści przez modele językowe

W kolejnym kroku wiadomość lub jej fragmenty analizuje model językowy wyspecjalizowany w wykrywaniu manipulacji i prób wyłudzenia. Nie chodzi tu o literówki czy błędy, ale o schemat wypowiedzi. Przykładowe pytania, na które model szuka odpowiedzi:

  • Czy pojawia się pilność („teraz”, „natychmiast”, „ostatnia szansa”), połączona z prośbą o działanie finansowe lub logowanie?
  • Czy nadawca stosuje techniki presji („jak nie zrobisz, będą konsekwencje”, „odpowiadasz za wynik”)?
  • Czy treść jest niespójna z wcześniejszą rozmową (nagła zmiana tematu, inny styl, brak nawiązań do wcześniejszego kontekstu)?

Model nie „rozumie” wiadomości jak człowiek, ale potrafi wychwycić podobieństwa do tysięcy wcześniejszych przykładów phishingu. Jeśli tekst wygląda jak wariacja na temat znanego szablonu ataku, wynik ryzyka rośnie, nawet jeśli żadne pojedyncze słowo nie jest podejrzane.

Krok 3: Sprawdzenie linków i załączników

Gdy w treści pojawia się link lub załącznik, w ruch idą wyspecjalizowane moduły. Ich zadaniem jest sprawdzenie, czy za ładnie wyglądającym adresem nie kryje się pułapka:

  • Analiza struktury URL – nietypowe subdomeny, dziwne kombinacje znaków, próby podszywania się pod znane marki (np. „bank‑polska‑bezpieczenstwo‑login.com”).
  • Symulowane odwiedziny strony – „wirtualna przeglądarka” otwiera stronę w odizolowanym środowisku, sprawdzając, czy nie próbuje pobierać złośliwego kodu albo podszywać się pod panel logowania.
  • Wykrywanie treści phishingowej na stronie – modele obrazu i tekstu rozpoznają formularze logowania do popularnych systemów (bankowość, poczta, chmura firmowa), a także typowe układy stron z phishingu.

W przypadku załączników, szczególnie dokumentów i plików graficznych, stosuje się z kolei połączenie skanera antywirusowego, technik sandboxingu i OCR (rozpoznawania tekstu na obrazach). To pozwala wychwycić np. fakturę‑fałszywkę w PDF, która zawiera link do „dopłaty” albo obrazek z kodem QR prowadzącym do panelu logowania.

Krok 4: Analiza kontekstu rozmowy i zachowania

Następnie filtr patrzy szerzej: nie tylko na pojedynczą wiadomość, ale na cały wątek i historię konta. Dla wielu osób to kluczowy moment, który odróżnia inteligentny filtr od zwykłego mechanizmu słów kluczowych.

Brane są pod uwagę między innymi:

  • Historia wymiany – czy nadawca i odbiorca wcześniej rozmawiali o tym temacie? Czy w tym kanale pojawiały się kwestie płatności lub dostępu do systemów?
  • Spójność stylu – czy „szef” nagle zaczyna pisać bardzo oficjalnie, choć zwykle używa skrótów i emotikonów? A może odwrotnie – dotąd poważny ton zmienia się w nagle zbyt swobodny?
  • Parametry logowania – czy wiadomość została wysłana z innego kraju, innej strefy czasowej lub nowego typu urządzenia, niż normalnie używa dana osoba?

Tu często zapada decyzja, czy ostrzeżenie będzie miało formę łagodnego „sprawdź u nadawcy innym kanałem”, czy też komunikator mocno zablokuje możliwość kliknięcia w link, wymagając potwierdzenia tożsamości.

Krok 5: Decyzja i forma reakcji

Na końcu wszystkie zebrane sygnały są łączone w ocenę ryzyka. Wbrew pozorom, celem filtrów nie jest „zakazać wszystkiego, co podejrzane”, lecz tak dobrać reakcję, żeby nie paraliżować pracy i nie zniechęcać użytkowników.

Najczęściej spotyka się kilka poziomów reakcji:

  • Ciche oznaczenie – wiadomość jest oznaczona wewnętrznie jako potencjalnie ryzykowna, co pomaga np. administratorowi firmowego komunikatora w identyfikowaniu trendów ataków.
  • Subtelne ostrzeżenie – mały baner pod wiadomością typu „Upewnij się, że znasz nadawcę. Ta treść przypomina znane próby wyłudzenia kodów SMS”.
  • Aktywna blokada – link lub załącznik są zasłonięte, wymagają dodatkowego potwierdzenia (czasem uwierzytelnienia wieloskładnikowego), a administrator może otrzymać alert.
  • Ograniczenie konta – w skrajnych przypadkach (np. silne podejrzenie przejęcia profilu) komunikator może tymczasowo zablokować wysyłanie nowych wiadomości do czasu potwierdzenia tożsamości przez właściciela.

Dla użytkownika różnica między tymi poziomami może wydawać się kosmetyczna, ale od niej zależy, czy filtr będzie traktowany jako pomocnik, czy jako przeszkoda. Zbyt agresywne blokady przy niewielkim ryzyku budzą frustrację; zbyt delikatne ostrzeżenia przy realnym ataku – poczucie, że system nie spełnia swojej roli.

Zbliżenie ekranu laptopa z interfejsem czatu AI w ciemnym otoczeniu
Źródło: Pexels | Autor: Matheus Bertelli

Przykłady działania nowych filtrów AI w popularnych komunikatorach

Komunikatory konsumenckie: ochrona przed „znajomym w potrzebie”

W aplikacjach używanych prywatnie (czaty rodzinne, grupy znajomych) dominują ataki podszywające się pod bliskie osoby. Klasyczny scenariusz: ktoś przejmuje konto, po czym wysyła krótką wiadomość typu „pożycz mi proszę, oddam jutro, muszę pilnie opłacić zamówienie”.

Nowe filtry potrafią tu zrobić kilka rzeczy naraz:

  • wykryć, że konto od dawna nie pisało bezpośrednio do tej osoby, choć są w jednej grupie,
  • zauważyć nagły wzrost liczby jednoczesnych rozmów z identyczną prośbą,
  • połączyć to z nietypową lokalizacją logowania lub nowym urządzeniem.

W efekcie komunikator może wyświetlić ostrzeżenie: „Te same prośby o przelew zostały wysłane do wielu osób. Zadzwoń do nadawcy, zanim dokonasz płatności”. To zwykłe zdanie często wystarcza, by ktoś na chwilę się zatrzymał i sprawdził sytuację poza komunikatorem.

Platformy biznesowe: ataki na przelewy i dane dostępowe

W firmowych komunikatorach (Slack, Teams i podobne) na celowniku są głównie pieniądze oraz dostęp do systemów. Przykłady:

  • podmiana numeru konta w rozmowie z działem księgowości,
  • prośby o tymczasowe dane logowania „dla audytorów” lub „partnerów”,
  • linki do rzekomych paneli SSO, które w rzeczywistości są stronami phishingowymi.

Nowoczesne filtry potrafią tutaj zestawić ze sobą kilka źródeł informacji. Na przykład: pracownik wysyła numer konta do działu finansów. System sprawdza, czy ten numer konto już występował w organizacji jako oficjalny. Jeśli nie – a w dodatku pojawia się nacisk czasowy („musimy wysłać dziś, bo inaczej tracimy zniżkę”) – filtr może podbić ryzyko.

W praktyce często kończy się to dyskretnym komunikatem: „Zmiana numeru konta dla tego kontrahenta. Zgodnie z polityką bezpieczeństwa wymagana jest dodatkowa autoryzacja przelewu”. Dzięki temu komunikator nie blokuje rozmowy, ale zmusza proces finansowy do przejścia przez dodatkowy krok weryfikacji.

Multimedia i kody QR: nowe pole do popisu dla AI

Coraz więcej ataków przenosi się z tekstu do obrazów. Zdjęcie „powiadomienia bankowego”, ekran „zwycięskiego konkursu” czy po prostu kod QR z informacją „zeskanuj, żeby odebrać przesyłkę” – to wszystko są wektory phishingu.

Tradycyjne filtry widzą tu tylko obraz. Rozszerzone systemy AI potrafią:

  • wykonać OCR na obrazku, czyli „wyciągnąć” z niego tekst,
  • wykrywać kody QR i odczytywać ich zawartość (adres URL, dane płatnicze),
  • porównywać elementy wizualne z oficjalnymi wzorcami marek, żeby wykryć nieudane podróbki.

Jeśli na przykład w czacie pojawia się screen rzekomego panelu logowania Google, system może rozpoznać, że adres w pasku przeglądarki nie jest prawdziwym adresem Google, albo że nie zgadzają się detale interfejsu. W takim przypadku użytkownik może zobaczyć ostrzeżenie typu „Ten obraz przypomina fałszywy ekran logowania. Nie wpisuj na nim swoich danych”.

Współdzielenie filtrów między produktami

Duże firmy technologiczne rozwijają filtry antyphishingowe jednocześnie dla poczty, chmury i komunikatorów. To oznacza, że jeśli dany typ ataku zostanie wykryty w e‑mailach, wiedza o tym może niemal od razu zostać wykorzystana także w czatach.

W praktyce wygląda to tak, że:

  • domena, która masowo wysyła fałszywe maile z fakturami, trafia do mechanizmów analizy linków w komunikatorze,
  • sygnatura nietypowego pliku (np. dokumentu instalującego malware) rozpoznanego w poczcie zaczyna być blokowana także w załącznikach na czacie,
  • nowy schemat wiadomości phishingowej rozpoznany w jednym produkcie (np. w poczcie) jest „uczonką” dla modeli analizujących treści w komunikatorze,
  • incydenty raportowane przez użytkowników w jednym kanale (np. w Drive) zasilają wspólny system reputacji dla domen, adresów IP i typów plików.

Dzięki temu komunikator może reagować na kampanię phishingową, zanim na czacie pojawi się jej pierwsza fala – ucząc się na podstawie prób ataku zaobserwowanych w innych usługach.

Granica między bezpieczeństwem a prywatnością: co filtry naprawdę przetwarzają

Mit „czytania wszystkiego” a rzeczywistość techniczna

Jedna z najczęstszych obaw brzmi: „czy to znaczy, że ktoś czyta każdą moją wiadomość?”. To zrozumiała reakcja – mechanizmy AI działają gdzieś „w tle”, więc łatwo sobie dopowiedzieć najgorszy scenariusz.

W praktyce filtry antyphishingowe w większości komunikatorów działają jak automatyczny strażnik, który:

  • patrzy na treści w postaci zanonimizowanych cech (np. „wiadomość zawiera prośbę o przelew + nacisk czasowy”),
  • unika przechowywania pełnych historii czatów w modelach, ograniczając się do krótkiego okna kontekstu (np. kilku–kilkunastu wiadomości),
  • często działa lokalnie na urządzeniu użytkownika, a do chmury wysyła jedynie wyniki analizy, a nie całą treść.

Dla kogoś z zewnątrz – także dla administratora – te dane wyglądają raczej jak statystyka niż jak czytelna rozmowa. Co nie znaczy, że nie ma tu żadnych zagrożeń dla prywatności. Są, ale są dość konkretne i da się je zrozumieć.

Jakie dane są typowo analizowane przez filtry AI

Z punktu widzenia technologii da się wyróżnić trzy główne kategorie danych, które przetwarzają filtry:

  • Treści wiadomości – tekst, linki, metadane o załącznikach; tu wchodzą w grę modele językowe, klasyfikatory, OCR.
  • Metadane techniczne – adresy IP, typ urządzenia, przybliżona lokalizacja logowania, godzina wysyłki, częstotliwość i kierunek wiadomości.
  • Dane o zachowaniu konta – wzorce pisania (np. długość zdań, używane zwroty), typowe kontakty, pora aktywności, sposób korzystania z funkcji komunikatora.

Nie wszystkie komunikatory analizują wszystko. W wielu przypadkach można wyłączyć część funkcji (np. zaawansowane wykrywanie phishingu w prywatnych rozmowach), choć zwykle odbywa się to kosztem ochrony.

Anonimizacja i pseudonimizacja: jak ogranicza się „wgląd” w rozmowy

Żeby połączyć bezpieczeństwo z prywatnością, dostawcy stosują zestaw technik, które ograniczają, co tak naprawdę „widzi” system bezpieczeństwa. W praktyce może to wyglądać tak:

  • Maskowanie danych wrażliwych – sekwencje przypominające numery kart, PESEL czy hasła są podmieniane na specjalne tokeny, zanim trafią do modułów uczenia maszynowego.
  • Hashowanie identyfikatorów – adresy e‑mail, ID użytkowników czy nazwy kanałów są zamieniane w ciągi, których nie da się łatwo powiązać z konkretną osobą bez dodatkowych kluczy.
  • Agregacja statystyczna – do „głównego” modelu trafiają dane w formie zbiorczej, np. „w tej godzinie odnotowano X wiadomości podobnych do phishingu”, a nie pełne treści.

To nie jest idealna tarcza – nadal istnieje ryzyko, że przy błędnej konfiguracji ktoś zobaczy za dużo. Natomiast przy poprawnie zaprojektowanym systemie dostęp do pełnej treści rozmów ma wąska grupa osób i jest to zazwyczaj utrudnione proceduralnie.

Szyfrowanie end‑to‑end a filtry antyphishingowe

Szczególne zamieszanie budzi połączenie dwóch pojęć: szyfrowania end‑to‑end (E2EE) i filtrów AI. Skoro treści są zaszyfrowane „od końca do końca”, to jak system ma cokolwiek analizować?

Stosuje się kilka podejść:

  • Analiza po stronie klienta – część logiki filtra uruchamia się bezpośrednio w aplikacji na telefonie lub komputerze. Dane nie opuszczają urządzenia w postaci odszyfrowanej, a do chmury trafia jedynie wynik oceny ryzyka.
  • Modele wbudowane w aplikację – uproszczone, zoptymalizowane sieci neuronowe zaszyte w kodzie, aktualizowane wraz z wersją komunikatora. Działają mniej spektakularnie niż ogromne modele w chmurze, ale dobrze radzą sobie z typowymi scenariuszami.
  • Metadane poza szyfrowaniem – samo E2EE dotyczy treści, niekoniecznie metadanych. System może więc wykorzystywać informacje o częstotliwości i kierunku wiadomości, nawet jeśli nie zna ich treści.

Dzięki temu komunikator może pokazać ostrzeżenie przy podejrzanym linku, nie „podsłuchując” całej rozmowy na serwerze. Ograniczeniem jest tu moc obliczeniowa telefonu – stąd kompromisy między głębokością analizy a płynnością działania aplikacji i zużyciem baterii.

Rola administratora w firmie: jakie ma oko na cudze rozmowy

W środowiskach biznesowych pojawia się dodatkowe pytanie: czy szef, dział IT lub bezpieczeństwa mogą „czytać wszystko”, skoro komunikator korzysta z filtrów antyphishingowych?

Najczęstszy model wygląda następująco:

  • administrator ma dostęp do logów bezpieczeństwa, w których widać zdarzenia typu „zablokowano link do domeny X w kanale Y o godzinie Z”,
  • w logach zwykle pojawia się fragment wiadomości lub skrócony opis incydentu, a nie pełna historią czatu,
  • dostęp do pełnej treści rozmów (jeśli w ogóle możliwy) wymaga przejścia formalnej ścieżki – np. zgody konkretnych osób, udokumentowania incydentu prawnego.

Niektóre firmy wręcz konfigurują system tak, by z premedytacją ograniczyć podgląd pełnych treści – po to, żeby zespół bezpieczeństwa pracował na sygnałach technicznych, a nie „prywatnych wątkach z pokoju projektu”. Zmniejsza to ryzyko nadużyć i niepotrzebnego stresu pracowników.

Co naprawdę „widzi” filtr, gdy oznacza wiadomość jako ryzykowną

Żeby oswoić się z działaniem filtrów, pomaga przełożyć to na kilka prostych przykładów. Przykładowo, gdy system flaguje rozmowę jako podejrzaną, mógł „zobaczyć” głównie to:

  • ciąg słów zgodny z wzorcami phishingu: „pilny przelew”, „niezwłocznie”, „bez logowania”, „tajne dane logowania”,
  • link do nowej domeny, której wcześniej nie używano w tej organizacji, podobnej do znanej marki,
  • wiadomość wysłaną o nietypowej porze z nowego urządzenia, równolegle do kilkunastu innych osób,
  • załącznik PDF z wykrytym w środku obrazem formularza logowania i kodem QR kierującym do innego adresu niż w części tekstowej dokumentu.

Nie potrzeba tu „ludzkiego czytania” całego czatu. Filtr łączy dziesiątki takich sygnałów w jedną ocenę ryzyka i dopiero na jej podstawie system proponuje reakcję.

Jak użytkownik może kontrolować poziom ingerencji filtrów

Na wielu platformach da się wyregulować, jak bardzo filtry mają ingerować w codzienną pracę. To dobra wiadomość dla osób, które cenią sobie niezależność albo po prostu nie chcą widzieć ostrzeżeń na każdym kroku.

Typowe możliwości konfiguracji to m.in.:

  • tryby czułości – od „konserwatywny” (więcej ostrzeżeń, mniej ryzyka) po „zrównoważony” i „minimalny” (ostrzegaj tylko przy wysokim prawdopodobieństwie ataku),
  • listy zaufanych nadawców i domen – wiadomości od określonych kontrahentów lub z wewnętrznych systemów są traktowane łagodniej,
  • lokalne wyjątki – użytkownik może sam oznaczyć konkretną rozmowę jako „znaną i zaufaną”, ograniczając w niej część ostrzeżeń (np. przy częstej wymianie linków testowych).

Czasem sensownym kompromisem jest model: „nie blokuj, tylko ostrzegaj”. Oznacza to, że linki pozostają klikalne, ale system wyświetla wyraźny komunikat, zanim użytkownik przejdzie dalej. Dla wielu osób to wystarczający „hamulec bezpieczeństwa”, bez poczucia, że ktoś im coś narzuca.

Przezroczystość działania: jak komunikatory tłumaczą decyzje filtrów

Frustrację użytkowników zmniejsza prosta rzecz: wyjaśnienie, dlaczego wiadomość została oznaczona jako podejrzana. Nowe generacje filtrów są coraz lepsze w takich krótkich, zrozumiałych uzasadnieniach.

Zamiast lakonicznego „Ta wiadomość jest niebezpieczna” pojawia się np.:

  • „Ta domena została niedawno zarejestrowana i występuje w znanych kampaniach phishingowych.”
  • „Treść wiadomości jest podobna do prób wyłudzenia pieniędzy, które zgłaszali inni użytkownicy w ostatnich dniach.”
  • „Ten plik PDF zawiera link prowadzący do strony podszywającej się pod system logowania Twojej firmy.”

Takie komunikaty nie odsłaniają technicznych szczegółów implementacji, ale dają odbiorcy poczucie kontroli: widzi, że filtr nie „wymyślił sobie” zagrożenia, tylko opiera się na konkretnych przesłankach. Łatwiej wtedy zaakceptować pojedyncze fałszywe alarmy i nie wyłączać ochrony przy pierwszym potknięciu systemu.