Jak Twoje dane mogą stanąć na przeszkodzie wdrożenia rozwiązań opartych o machine learning i AI?

Czy Twoja firma jest gotowa na wdrożenie rozwiązań opartych o machine learning i AI? Razem z Marcinem Wochem, CEO Algolytics, rozmawiamy o wyzwaniach, które napotykają firmy podczas ich wdrażania.

Marcin Woch jest doświadczonym ekspertem Data Science z dwudziestoletnim doświadczeniem, zdobytym przy projektach dla czołowych firm telekomunikacyjnych, finansowych i e-commerce, takich jak Polkomtel, P4, mBank, Alior Bank, Bonprix, Comperia i DHL. Jest również współtwórcą platformy DSML Algolytics, koncentrującej się na uczeniu maszynowym i MLOps.

W swojej pracy Marcin Woch skupia się na automatyzacji i optymalizacji procesów decyzyjnych za pomocą systemów predykcyjnych opartych na uczeniu maszynowym. Specjalizuje się w zarządzaniu ryzykiem finansowym, przeciwdziałaniu nadużyciom oraz wsparciu procesów sprzedaży, w szczególności w zakresie precyzyjnego targetowania działań marketingowych. W swoich projektach wykorzystuje pełnię dostępnych zasobów danych, w tym danych przestrzennych.

Chcesz poznać perspektywę Marcina w kontekście tworzenia data-driven organizacji? Przejdźmy w takim razie do rozmowy.

1. Co najczęściej przeszkadza firmom we wprowadzaniu rozwiązań opartych o Machine Learning i AI?
Czynników utrudniających wdrożenie rozwiązań opartych o AI/ML jest wiele. Można wymienić takie jak brak specjalistów czy know-how w organizacji, brak zrozumienia zagadnienia, wątpliwości natury prawnej czy etycznej. Dla mniejszych organizacji powodem może być też koszt samych narzędzi.
Jednak kluczowym wyzwaniem, z którym boryka się większość organizacji, jest brak odpowiedniej ilości zgromadzonych danych lub ich niska jakość.

AI i uczenie maszynowe wymagają ogromnej ilości danych. Dane te muszą być odpowiednio zebrane, przetworzone i przechowywane. Bez nich technologie te nie są w stanie funkcjonować efektywnie. Jest to związane z tym, że AI i uczenie maszynowe bazują na analizie danych. Im więcej danych jest dostępnych, tym lepsze wyniki mogą osiągnąć te technologie. Firmy, które chcą skutecznie wykorzystywać AI i uczenie maszynowe, muszą zadbać o odpowiednią infrastrukturę, która umożliwi przechowywanie i przetwarzanie danych. Muszą również wprowadzić odpowiednie praktyki zarządzania danymi, takie jak data governance.
Jednak nie należy zapominać, że samo źródło danych, sposób ich powstawania, jest osobnym problemem, który wymaga szczególnej uwagi. Wiele danych przetwarzanych przez firmy pochodzi od klientów lub pracowników. Często są one wprowadzane manualnie, są deklaratywne, niezweryfikowane lub po prostu niekompletne. Przykładowo, klient może nie pamiętać wszystkich elementów własnego adresu, co skutkuje niepełnymi danymi. W przypadku, gdy dane są niekompletne czy niepoprawne, pojawiają się duplikaty. Na przykład, pracownik może wprowadzić drugi raz kontakt do CRM, ponieważ system nie potrafi odnaleźć wcześniejszego niekompletnego wpisu.
W niektórych sytuacjach sporym wyzwaniem są również dane fałszywe, zmanipulowane, które powstały na przykład w trakcie prób nadużycia. Takie dane mogą skutecznie zniekształcać obraz i prowadzić do błędnych wniosków czy decyzji opartych na analizie AI i uczenia maszynowego.

2. Co jest największym wyzwaniem dla data-driven organizacji?
Zostanie organizacją data driven wymaga czasu, odpowiedniej strategii, zadbania o jakość danych oraz kulturę.
Firmy powinny mieć zdefiniowaną strategię wykorzystania danych do optymalizacji własnej działalności. Strategię określającą sposób, w jaki dane są zbierane, przechowywane, zarządzane i wykorzystywane przez organizację. Brak takiej strategii jest często źródłem problemów z jakością danych i ostatecznie utrudnia lub uniemożliwia szersze wykorzystanie technik ML/AI.

Według raportu TWDI z 20221 roku jedynie 20% badanych firm było zadowolonych z swojej strategii dotyczącej danych, a do najważniejszych zadań należało zwiększenie ich jakości oraz usprawnienie całego procesu data governence2.

Kolejnym istotnym elementem jest zadbanie o odpowiednią kulturę wewnątrz organizacji, w związku ze zbieraniem, dzieleniem się i wykorzystywaniem danych.

Od wielu lat ponad 90% zarządzających organizacjami3 wskazuje brak odpowiedniej kultury jako największą przeszkodę przy zostawaniu organizacjami data driven. Z drugiej strony 2/3 osób odpowiedzialnych za zarządzanie danymi wskazuje brak odpowiedniego wsparcia od zarządzających w obszarze danych i analityki oraz tworzenie pustych obietnic w tym obszarze4.
Zostanie organizacją data driven to trudny i kosztowny proces, który ponad 90% firm zajmuje co najmniej 2 lata5, a to oznacza, że decyzje podjęte dzisiaj nie będą szybko widoczne.

3. Z jakimi danymi firmy mają problem? Jak często dane są niepoprawne?
Tutaj należy podzielić zasoby danych na te generowane przez algorytmy, systemy informatyczne i te „generowane” przez ludzi.
Dane generowane przez algorytmy i systemy informatyczne są zwykle bardziej precyzyjne i mniej podatne na błędy niż dane generowane przez ludzi. W przypadku tych danych, błędy zwykle wynikają z błędów w algorytmach i są stosunkowo łatwe do zidentyfikowania i skorygowania. Jednakże, nawet w przypadku tych danych, mogą wystąpić problemy. Na przykład, zdarzają się sytuacje, gdy firma traci dane, na przykład gdy nie jest zapisywana historia zmian i przedsiębiorstwo dysponuje jedynie stanem aktualnym.
Druga kategoria danych, czyli te generowane przez ludzi, nastręcza znacznie większych problemów w zapewnieniu wysokiej jakości. Dane te często są nieustrukturyzowane, a duża liczba osób (klientów, pracowników) wprowadzających dane sprawia, że nie jesteśmy w stanie mieć nad ich „źródłem” pełnej kontroli.

Dane wprowadzane lub generowane przez ludzi to często dane osobowe, kontaktowe, adresowe, które są kluczowe z punktu widzenia poprawności przeprowadzenia transakcji i sprawności operacyjnej. Ich walidacja i weryfikacja wymaga wyspecjalizowanych narzędzi, a błędy mogą prowadzić do poważnych konsekwencji, takich jak niepoprawne faktury, problemy z dostawą czy niezadowolenie klientów.
Zasadniczo większość pozyskiwanych danych osobowych i adresowych w mniejszym lub większym stopniu jest niezgodna z ich wystandaryzowaną formą. Literówki, błędy, niekompletne dane to powszechne zjawisko, które utrudnia ich skuteczne wykorzystanie.

4. Czemu firmy powinny dbać o jakość danych adresowych i kontaktowych? Jakie problemy pojawiają się, gdy jakość jest niska?

Dane adresowe stanowią istotny element identyfikujący klienta oraz służą do komunikacji z nim lub do wysyłki zamówionych produktów. Jednakże, jeśli te dane są niedostatecznej jakości, wymienione procesy nie działają poprawnie. Jakie mogą być konsekwencje?
Zduplikowane konta i niezintegrowane dane zamówień w systemie CRM prowadzą do niepoprawnej prezentacji danych. Każdy system z nich korzystający, na przykład marketing automation, może działać nieprawidłowo. Kolejne problemy to niedostarczona korespondencja oraz niedostarczone przesyłki. W konsekwencji, powoduje to straty finansowe (dodatkowy nakład pracy) oraz niezadowolenie klienta.
Ostatnią grupą problemów są problemy w obszarze analitycznym. Aspekt przestrzenny (tzw. Location Intelligence) w analityce jest często bardzo ważnym zagadnieniem dla firm. Odpowiedź na takie pytania jak:

Gdzie mieszkają nasi klienci i jaki mają profil?
Gdzie zlokalizować punkty sprzedaży tak, aby dotrzeć do jak największej liczby klientów?
Jak budować telekomunikacyjną sieć radiową, aby jak największa grupa naszych klientów miała dostęp do wysokiej jakości usługi?
Jaki jest potencjał ekonomiczny, zakupowy mieszkańców danego obszaru?

staje się utrudniona, gdy nie jesteśmy w stanie „zmapować” przestrzennie naszych klientów i zbudować profili, które można wykorzystać w optymalizacji naszych działań marketingowych czy sprzedażowych.

5. Czego można dowiedzieć się z danych adresowych? Jak można je wykorzystać?
Wiele zależy od zakresu działalności i produktu firmy. Wiele cech i zjawisk istotnych z punktu widzenia marketingu, sprzedaży czy pozyskiwania klientów silnie różnicuje się przestrzenie. Znając miejsce zamieszkania naszego klienta możemy oszacować sporo informacji o nim. Przykładami często wykorzystywanych informacji są demografia, siła nabywcza, potencjały zakupowe, nasycenie lokalnego rynku różnego rodzaju produktami.

Firmy mogą wykorzystać dane adresowe, aby poprawić efektywność swoich działań marketingowych poprzez dostarczenie spersonalizowanych treści i ofert, skierowanych do konkretnych grup docelowych. Mogą również wykorzystać te dane do tworzenia bardziej dokładnych profili klientów i lepszego zrozumienia ich potrzeb.

6. Czy lokalizacja jest dobrym predyktorem w kontekście braku spłaty lub nadużyć?.
Tak, jest to jedno z często wykorzystywanych zastosowań analizy danych adresowych klienta. Mając odpowiednie dane można przeprowadzić analizę adresu pod kątem jego poprawności i na tej podstawie stwierdzić, czy adres jest fikcyjny, a także wykryć ryzyko, że adres nie jest rzeczywistym adresem klienta. Takie zdarzenie może wskazywać na próbę nadużycia.
Sam adres jest również cenną informacją do identyfikacji powiązań między klientami, transakcjami czy wnioskami, na przykład o pożyczkę. Duża liczba złożonych wniosków z tym samym adresem korespondencyjnym może również wskazywać na próbę nadużycia.
Oprócz formalnej analizy adresu można też stosować metody scoringowe do oceny ryzyka czy potencjałów. Np. dla naszych klientów szacujemy ryzyko defaultu (zaprzestania spłaty zobowiązania) i nadużycia m.in. na podstawie podanego adresu. Z naszych wdrożeń wynika, że model ten ma wysoką skuteczność, porównywalną z modelami budowanymi w oparciu o dane finansowe klienta takie jak informacje o spłacie innych zobowiązań, dane transakcyjne z kont bankowych.

7. W jaki sposób Algolytics pomaga firmom wykorzystywać potencjał własnych danych?
Fundamentem jest tu nasze rozwiązanie Algomaps, które pozwala rozwiązać wcześniej wspomniane wyzwania związane z niską jakością danych. Algomaps dokonuje standaryzacji i czyszczenia danych adresowych (ujednolica ich zapis, usuwa duplikaty itp.), a następnie umożliwia ich geokodowanie (przypisanie konkretnych współrzędnych geograficznych z 99% skutecznością). Wdrożenie Algomaps zwiększa tym samym efektywność operacyjną – ogranicza manualną pracę i poprawia jakość dokonywanych analiz.

Nasze rozwiązania Location Intelligence wykorzystywane są też do podejmowania strategicznych decyzji biznesowych takich jak lokalizacja nowego punktu sprzedaży, wycena nieruchomości czy wybór obszaru działań marketingowych. Wspieranie podejmowania tego typu decyzji jest możliwe dzięki naszej kompleksowej bazie danych adresowych, która zawiera szczegółowe informacje dla każdego adresu (np. demografia mieszkańców, liczba punktów sprzedaży danego typu w zasięgu X km).

Innym naszym rozwiązaniem jest Geoscoring, który pozwala ocenić ryzyko kredytowe danego klienta w ciągu kilku milisekund na podstawie jedynie jego adresu zamieszkania. Przyspiesza więc istotnie proces kredytowy (zarówno dla klienta jak i dla firmy) przy zachowaniu zbliżonej skuteczności prognozy do bardziej zaawansowanych (i przez to bardziej złożonych i czasochłonnych we wdrożeniu) algorytmów.
Profilowanie klienta w oparciu o dane lokalizacyjne ma też wiele innych zastosowań. Preferencje klientów, ich zachowania zakupowe, bardzo silnie różnicują się przestrzennie. Jako przykład można podać kwalifikacje leadów w Call Center do kontaktu. W jednym z wdrożeń osiągnęliśmy 85% redukcji liczby nieskutecznych kontaktów w CC, korzystając z oceny potencjału leada na bazie m.in. danych adresowych.

Jak Twoje dane mogą stanąć na przeszkodzie wdrożenia rozwiązań opartych o machine learning i AI?

KONTAKT

25 – 26 MARCA 2024 / THE WESTIN WARSAW HOTEL