Dołącz do czytelników
Brak wyników

Czym jest i jak działa semantic search

Artykuł | 20 października 2018 | NR 38
167

Sposób, w jaki użytkownicy przeszukują sieć w poszukiwaniu informacji, zmienił się diametralnie na przestrzeni ostatnich lat. Konieczność dostarczania dopasowanych i jakościowych wyników wyszukiwania napędza rozwój nowych algorytmów i metod prezentowania treści.

Pojawiające się nowe technologie umożliwiają użytkownikom wyszukiwanie i komunikowanie się z urządzeniami w zupełnie nowy sposób (wyszukiwanie głosowe), naturalne formułowanie zapytań i konwersację z urządzeniami i wyszukiwarkami. To z kolei znów napędza rozwój algorytmów i technologii, by lepiej rozumieć naturalny język i znaczenia wyrazów oraz by sprostać rosnącym wymaganiom użytkowników. W ten sposób koło się zamyka.

Konkurencja w wyszukiwaniu to już nie tylko komputer i przeglądarka. Amazon jest doskonałą wyszukiwarką produktów i opinii na ich temat, a asystenci personalni – Google Home, Amazon Echo i Alexa oraz Siri i ostatnio zapowiedziany Apple HomePod – są bezpośrednią konkurencją w zakresie wyszukiwania głosowego. Nowe technologie wymusiły nowe metody poszukiwania informacji.

Gdzie w tym wszystkim jest semantic search?

Początki: Google Knowledge Graph i Hummingbird (aktualizacja Koliber)

Możemy powiedzieć, że wyszukiwanie semantyczne pojawiło się wraz z nadejściem Google Knowledge Graph (//goo.gl/aWyhzk) w maju 2012 r. i algorytmu Koliber (//goo.gl/9kLp5s) w 2013 r. Obie aktualizacje są ze sobą powiązane i były przełomowe, jeśli chodzi o sposób, w jaki Google odczytywał zapytania użytkowników i prezentował dla niego wyniki wyszukiwania. 

Żeby lepiej zrozumieć temat wyszukiwania semantycznego, warto spojrzeć – w skrócie – na kontekst historyczny (jeżeli lata 2012 i 2013 możemy nazwać historią), w jakim rozwijał się semantic search. Knowledge Graph – Things not strings. Rzeczy, nie tekst – słowa nie są już tylko zlepkiem znaków. Są obiektami powiązanymi znaczeniami i odnoszącymi się do innych obiektów. Graf wiedzy w szybki i przejrzysty sposób dostarcza informacji na temat wyszukiwany przez użytkownika – spośród milionów obiektów, które ma w swojej bazie, i powiązań pomiędzy nimi. Internauta nie musi przeklikiwać się przez kolejne wyniki wyszukiwania, by znaleźć informacje, które go interesują – są one dostępne bezpośrednio z poziomu wyników wyszukiwania Google. 

Czy wiesz, że...

  • Łatwo zrozumieć, dlaczego wyszukiwarki dążą do jak najlepszego zaspokajania potrzeb swoich użytkowników i ograniczania nieprzydatnych i śmieciowych wyników. 
  • Od jakości prezentowanych wyników wyszukiwania zależy ich być albo nie być.
  • Użytkownicy korzystają z produktów, które zaspokajają ich potrzeby, a jeśli – w tym przypadku wyszukiwarki – nie dostarczą wyników odpowiadających na zapytanie internauty, istnieje szansa, że pójdzie on do konkurencji.

 

Głównym zadaniem algorytmu Koliber było jeszcze dokładniejsze odczytywanie i zrozumienie intencji użytkownika, które pozwalało na lepsze dopasowanie wyników wyszukiwania do konkretnego zapytania – biorąc pod uwagę właśnie intencję, kontekst i znaczenie zapytania wystosowanego przez użytkownika. Słowa przestały być jedynie zlepkiem liter. Teraz zaczęły mieć sens.

Serwis SearchEngineLand określił aktualizację Koliber jako kompletną zmianę dotychczasowego algorytmu rankującego Google (//goo.gl/FGgsoM), a sama nazwa miała wziąć się stąd, że jest on „szybki i precyzyjny”.

Hummingbird miał znaczący wpływ na rozwój wyszukiwania głosowego, robiącego (szczególnie ostatnio) duży szum w świecie e-marketingu i SEO. Nie bez przyczyny – 
sprzedaż urządzeń asystentów osobistych (Google Home, Amazon Alexa) i wykorzystanie wyszukiwania głosowego dynamicznie rośnie – odsyłam do fantastycznego wpisu na blogu Branded3 (//goo.gl/ywPtqq) z podsumowaniem tych trendów.

Co to jest semantic search?

Wykorzystując semantykę, odczytywanie intencji, znaczeń wyrazów, kontekstu, w jakim zadane zostało pytanie, świadomości rzeczy i powiązań pomiędzy nimi, Google może dostarczyć użytkownikowi bardziej dopasowane, odpowiednie i spersonalizowane wyniki wyszukiwania. I radzi sobie z tym całkiem dobrze.

Wykorzystując naturalny język (wpisując zapytanie do wyszukiwarki lub wyszukując głosowo), na użyte zapytanie „kto gra w stranger things” można otrzymać odpowiedni wynik z obsadą serialu w formie karuzeli ze zdjęciami, nazwiskami i graną postacią – mimo że w pytaniu nie zawarto słowa „obsada”.

Algorytmy potrafią zrozumieć intencję i znaczenie zapytania, by wyświetlić odpowiednie wyniki wyszukiwania. W kolejnym przypadku Google wie, że szukam tytułu najnowszego albumu zespołu Iron Maiden – nie muszę wchodzić na stronę zespołu czy wertować forum w poszukiwaniu tej informacji. Dostaję ją od ręki, już na poziomie wyników wyszukiwania.

Google daje również konkretną odpowiedź na bardziej szczegółowe zapytania – rozumiejąc na przykład różnicę pomiędzy pytaniem o wiek a pytaniem o datę urodzenia konkretnej osoby (w obu przypadkach odpowiedź będzie dopasowana do pytania). Podsuwa również inne, mogące mnie zainteresować informacje.

Graf wiedzy. Rzeczy, nie znaki, i powiązania pomiędzy rzeczami. Aktualizacja Koliber. Wyszukiwanie semantyczne. Jak to wszystko połączyć?

Na wykresie zaznaczono przykład rzeczy (pogrubiona czcionka, niebieska ramka) – obiektów, do których odnoszą się inne rzeczy, a także powiązania i rodzaj powiązań pomiędzy nimi (strzałki i tekst w zielonej ramce). Sprawdź sam, jak takie obiekty i powiązania mogą wyglądać na WikiData (//www.wikidata.org/wiki/Q484302). 

Google rozpoznaje intencję i znaczenie zapytania i na podstawie dostępnych danych wyświetla konkretną odpowiedź. Mało tego – algorytmy „wiedzą”, że warto zasugerować mi „podobne wyszukiwania” dotyczące innych członków zespołu, ponieważ wiedzą, o co pytam i o co mogę jeszcze zapytać!

Kiedy kontynuuję wyszukiwanie, Google odczytuje moją intencję i daje trafne podpowiedzi, trzymając się kontekstu mojego poprzedniego zapytania.

Galeria wyszukiwarki Google wskazuje na wiele elementów, które może wyświetlić w wynikach wyszukiwania. Należą do nich m.in.:

  • informacje kontaktowe,
  • logotyp i wewnętrzna wyszukiwarka,
  • Twoje profile w sieciach społecznościowych,
  • informacje o nadchodzących wydarzeniach,
  • oferty pracy (od niedawna),
  • informacje o produktach (ceny, opinie, dostępność, inne),
  • przepisy (zdjęcie, czas gotowania, kalorie),
  • oceny i recenzje (liczba ocen, ocena całkowita).

 

Dane strukturalne, Google i Schema.org – przydatne linki

Jeśli chcesz wdrożyć dane strukturalne w swoim serwisie, to są zasoby, które mogą Ci się przydać:

  • galeria wyszukiwarki: //developers.google.com/search/docs/guides/search-gallery
  • narzędzie do testowania danych strukturalnych: //search.google.com/structured-data/testing-tool
  • marker danych strukturalnych: //www.google.com/webmasters/tools/data-highlighter – jeśli nie masz możliwości wdrożenia znaczników bezpośrednio w kodzie witryny.

 

Jeśli wyszukam słowo „koncerty” bez uprzedniego podania w wyszukiwarce kontekstu, otrzymam ogólne podpowiedzi, które mogą naprowadzić mnie na poszukiwany temat.

Tabela 1.