Kiedy potrzeba skuteczności, a dopiero potem zrozumienia
Na skróty: Jeśli szukasz informacji o sieciach Bayesa, technikach regresyjnych, drzewach decyzyjnych (CHAID, CART i innych), szeregach czasowych bądź pokrewnych zagadnieniach, które chcesz zastosować w biznesie - zadzwoń do nas. Będziemy godnymi partnerami w rozmowie.
Na spokojnie: Data Mining (drążenie danych) opiera się na technikach automatycznej analizy danych, których zadaniem jest rozpoznanie wzorców i zależności występujących pomiędzy dużą ilością zmiennych w rozległych bazach. W zastosowaniach biznesowych pojawia się najczęściej tam, gdzie występują dane transakcyjne i gdzie jest dużo klientów.
Najczęstszym zastosowaniem technik Data Mining są przypadki, w których potrzeba poprawnie określić prawdopodobieństwo jakiegoś zjawiska, np. odejścia klienta (churn) czy szansy na sprzedaż (cross-, up-selling). Szczególnym sposobem wykorzystania data miningu jest użycie go do klasyfikacji - aby odpowiednio posegmentować Twoich klientów. Tradycyjne statystyki często okazują się niewystarczające - zbyt słabo kontrolują ukryte interakcje i zależności, bądź też są zbyt złożone obliczeniowo, żeby szybko pracować na wielomilionowych bazach danych.
W tym przypadku stawiamy na wydajność, a nie na zrozumienie. Budowane modele, to często "czarne skrzynki", których logika jest trudna do pełnego zobrazowania. Dlatego też, powodzenie technik drążenia danych, zależy od wcześniejszego przygotowania:
- jakości danych ("garbage in, garbage out")
- zrozumienia zawartości danych i ich wcześniejszej analizy
Jako analitycy nie chcemy ograniczać się do czarnych skrzynek. Potrafimy je jednak budować wszędzie tam, gdzie etap rozumienia danych jest już za nami, a teraz przyszedł czas na maksymalną skuteczność predykcji odnośnie prawdopodobieństwa odejścia czy też sprzedaży kolejnego produktu.