Dołącz do czytelników
Brak wyników

Temat numeru

1 września 2021

NR 59 (Sierpień 2021)

Dane – skąd się biorą, jak na nie uważać i co z nimi można zrobić?

14

W okolicach połowy poprzedniej dekady świat zachłysnął się potencjałem danych. Określało się je jako cenniejsze niż ropa. Big Data odmieniano przez wszystkie przypadki. Prezesi największych firm, które swój biznes oparły na danych (Facebook, Amazon, Google), byli traktowani jak gwiazdy rocka. W 2013 r. powstał nawet film o tym, jak fajnie jest być stażystą w Google! Niestety, brak powszechnego uregulowania kwestii przetwarzania danych doprowadzał do wielu patologii w ich wykorzystywaniu.

Rok 2018 był przełomowy dla sytuacji związanej z patologiami dotyczącymi przetwarzania danych. Skandal z Cambridge Analytica i wejście w życie przepisów związanych z RODO sprawiły, że tematyka prywatności danych wyszła na pierwszy plan. Od tamtej pory modne stało się wprowadzanie ograniczeń dla systemów mierzących wszystko w imię prawa do prywatności. Stan Kalifornia wprowadził swój odpowiednik RODO, czyli CCPA, natomiast Kanada wprowadziła PIPEDA. Safari zablokował domyślnie third party cookies, Google również planuje to zrobić w swoim Chrome, a Firefox i Edge udostępniają taką możliwość. iOS 14 wprowadził możliwość decydowania o tym, czy chcemy danej aplikacji pozwolić na śledzenie.
 

Rys. 1. Mark Zuckerberg w Parlamencie Europejskim
© European Union 2018 – European Parliament


Nikogo nie powinno dziwić, że ludzie bardzo chętnie korzystają z nowo nabytego prawa. Zdecydowana większość użytkowników iOS 14 nie zgadza się na śledzenie. Stawia to nas, marketerów, w niewygodnym położeniu. Z jednej strony dorzuca masę formalności (np. lista wszystkich trackerów w polityce prywatności powinna być na bieżąco aktualizowana), z drugiej prowadzi do dość niebezpiecznej sytuacji. Google i Facebook już dawno wskazały swoim reklamodawcom, w jaki sposób powinni wpinać ich kody na stronach, by działały w nowej rzeczywistości. Mają do tego prawo, ponieważ dane należą do nich, jako do jednej firmy. Inaczej sytuacja ma się w przypadku ich konkurencji opierającej się na dzieleniu danymi między różnymi podmiotami. Nowe ograniczenia prawno-technologiczne sprawiają, że zmniejszy się konkurencja na rynku reklamy, który już teraz jest dość mocno zdominowany przez pozycję gigantów z Doliny Krzemowej. 
Stawia nas to w pozycji utrudnionego nawigowania przez obostrzenia aspektów technologicznych, dlatego w niniejszym artykule znajdziesz przewodnik po tym, jak funkcjonować w tym zmieniającym się środowisku.

Jak pozyskiwane są dane i jakie płyną za tym konsekwencje

Dane możemy podzielić na 3 typy za względu na ich źródło pochodzenia:
 

 

Na co dzień jako marketerzy korzystamy ze wszystkich tych źródeł przy targetowaniu naszych kampanii. Często targety, które wykorzystujemy, są po części zbierane z kilku rodzajów źródeł jednocześnie (np. do targetu parenting wchodzą osoby wrzucające np. na Facebooku wydarzenie z życia – narodziny dziecka – oraz osoby, które w ostatnim czasie kupiły przez internet 8 paczek pieluch). Korzystając z nich, powinniśmy mieć świadomość, jak zostały pozyskane, by wiedzieć, jakie wady mogą nieść za sobą.

Dane deklaratywne

Dane deklaratywne to te uzupełniane we wszelkiej maści formularzach internetowych. To z nich pochodzi większość informacji na temat demografii (wiek, płeć, zawód, wykształcenie), a także część danych wykorzystywanych w personalizacji i kontakcie z grupą docelową – imię, nazwisko, e-mail, numer telefonu czy pseudonim. W bardziej wyspecjalizowanych serwisach, jak np. porównywarki ubezpieczeń, znajdziemy też model samochodu. Wydawałoby się, że ten rodzaj danych jest najbardziej rzetelny – w końcu wykorzystujemy te informacje, jakie ludzie podali samodzielnie. Musimy jednak pamiętać o kilku kwestiach. Przede wszystkim, zazwyczaj chcemy się prezentować z tej najlepszej strony, co oczywiście wpływa na jakość takich danych. Musimy zwrócić także uwagę na:

  • Aktualność
    Załóżmy, że prowadzimy kampanię, w której chcemy dostać się do pracowników wysokiego szczebla czy prezesów firm. Bierzemy wtedy pod uwagę w pierwszej kolejności Facebooka i LinkedIn, czyli portale, na których ludzie podają swoje stanowiska. Jak unaoczniła nam pandemia koronawirusa, nic nie jest wieczne i sytuacja dynamicznie się zmienia – ludzie tracą pracę, firmy bankrutują. W takich chwilach naszym pierwszym odruchem nie jest aktualizowanie informacji o byciu bezrobotnym. Podobnie zresztą sytuacja wygląda w przypadku zmiany pracy – często na okresie próbnym nikt nie decyduje się na aktualizację profilu. Analogicznie, nieaktualne są informacje o statusie związku, a w kontekście zawodowym te związane z urlopem macierzyńskim. Dlatego z tyłu głowy powinniśmy mieć to, że nasze dane mogą być nie do końca zgodne z prawdą.
     
  • Efekt ankietera
    Pokrewną konsekwencją, wynikającą jednak często z innych pobudek, jest tzw. efekt ankietera. Wśród ofert opartych na badaniach ankieterskich – zwłaszcza tych telefonicznych – często można zauważyć wyraźne przekłamania. Dobrze to widać na przykładzie badań słuchalności radia. Zazwyczaj spotykamy się tam z niedoreprezentowaniem ludzi bezrobotnych i nadreprezentacją osób na wysokich stanowiskach (inaczej niż podają statystyki). Czy to znaczy, że ludzie bezrobotni nie słuchają radia? Moim zdaniem niekoniecznie – po prostu, w naszej kulturze nie jest komfortową sytuacją przyznawać się do takiej sytuacji, w związku z czym często podawane jest np. poprzednie stanowisko. Podobny efekt obserwujemy również w social mediach. 
     
  • Żarty – te mniej śmieszne
    Dla człowieka pracującego na dużych bazach danych osobowych nie jest zaskakujące zobaczyć imię i nazwisko „Twoja Stara”, zawód „Szlachta nie pracuje”, czy od czasu pojawienia się pola „inne” w sekcji płeć, znalezienie „śmigłowca szturmowego”. Generuje to dużo problemów w budowaniu odpowiednich grup docelowych. W większości przypadków udaje się to wyfiltrować, ale tu i ówdzie na dużych zbiorach danych zdarzy się, że „Uniwersytet Lansu i Baunsu” przejdzie jako wykształcenie wyższe.
     
  • Wiek
    Nie jest tajemnicą, że największe serwisy internetowe i media społecznościowe zazwyczaj mają dolną granicę wieku do założenia u nich konta. Czasem, ze względu na treści dla dorosłych lub kwestie formalne, jest to 18 lat (Konto Google Ads, Netflix), czy 13 w związku z wymogami ochrony danych osobowych poniżej tego wieku (YouTube, TikTok, Facebook). Serwisy ograniczają dostęp do różnych treści i funkcjonalności młodym użytkownikom, tworząc alternatywne wersje serwisów (YouTube Kids, Konto Junior na Allegro, Netflix). Dlatego miliony nastolatków na całym świecie kłamią i z tego powodu zwłaszcza na serwisach atrakcyjnych z różnych względów dla osób młodszych należy spodziewać się, że statystyki dotyczące wieku mogą być zawyżone. Jednocześnie pamiętajmy, że te serwisy mają już po kilka lat, więc jak ktoś naciągnął swój wiek w 2016 r., to teraz jest spore prawdopodobieństwo, że nadal widnieje ten przekłamany.
     
  • Funkcję „Zaloguj przez Facebooka”
    Jest to coraz częściej wykorzystywany sposób logowania, zwłaszcza w środowisku mobilnym. Stanowi on ułatwienie, dzięki któremu użytkownik przekazuje za pośrednictwem Facebooka informacje do aplikacji. Wiąże się to z kilkoma konsekwencjami. Gdy w naszej bazie wykorzystamy ten schemat, otrzymamy dane w takiej jakości i dokładności, z jaką użytkownik podał je na Facebooku. Drugą, mniej znaną konsekwencją, jest to, że dane są przekazywane w dwóch kierunkach. Załóżmy, że stworzyliśmy aplikację służącą do wyszukiwania ofert z mieszkaniami na wynajem w Warszawie – musimy być świadomi, że Facebook wykorzysta te dane do profilowania użytkowników i później będą one mogły być wykorzystane do kampanii reklamowych konkurencji.

Dane behawioralne

Udało nam się ustalić, że ludzie kłamią – nic nowego. Przejdźmy zatem do tego, czego dotyczy zamieszanie wokół prywatności w ostatnich latach. Dane behawioralne to dane tworzące profil na podstawie naszych zachowań w internecie. Na ich podstawie mamy dostępne targetowanie związane z zainteresowaniami, intencjami zakupowymi i, oczywiście, remarketingiem. Z grubsza można je podzielić na dwie kategorie:

  • Dane posiadane przez serwis, na którym publikujemy reklamy
    Warto się zastanowić, jakie informacje na temat użytkownika może posiadać serwis. Nietrudno się domyślić, że dokładność wiedzy na temat zainteresowań użytkownika będzie na innym poziomie na TikToku, innym na Facebooku i jeszcze innym na Pintereście. Dla przykładu, to, że ktoś jest zainteresowany parentingiem na TikToku, może być powiązane z oglądaniem treści publikowanych z hashtagami związanymi z rodzicielstwem, a na Facebooku może oznaczać, że lajkuje strony piszące o tym temacie lub strony producentów produktów dla dzieci. Na podstawie danych z Pinteresta możemy stwierdzić, czy planuje np. urodziny dla dziecka lub wystrój pokoju dziecięcego. Dodatkowo należy pamiętać, że np. Mercedesa AMG na Facebooku może lajkować 14-letni chłopak, który przynajmniej na razie nie ma środków na jego zakup.
     
  • Dane, które dostarczają reklamodawcy lub serwisy z sieci reklamowych
    Informacje te powodują najwięcej zamieszania, ponieważ to właśnie przekazywanie ich między firmami bez świadomości użytkownika budziło i budzi największe obawy. Obecnie wymagane jest, by w polityce prywatności strony www lub aplikacji podawać wszystkie firmy, do których przekazujemy dane na temat użytkownika, nawet jeżeli jest to prosta informacja o obecności na stronie. Dane te są wykorzystywane przede wszystkim do retargetingu. Jest on jednym z bardziej skutecznych działań, jakie są dostępne w arsenale marketera nastawio...

Pozostałe 70% treści dostępne jest tylko dla Prenumeratorów

Co zyskasz, kupując prenumeratę?
  • 6 drukowanych wydań magazynu Online Marketing
  • Dodatkowe artykuły niepublikowane w formie papierowej
  • Dostęp do czasopisma w wersji online
  • Dostęp do wszystkich archiwalnych wydań magazynu oraz dodatków specjalnych
  • ... i wiele więcej!
Sprawdź szczegóły

Przypisy