Wyszukiwanie semantyczne to jeden z największych przełomów w tym, jak Google podchodzi do rozpoznawania zapytań użytkowników. Na czym dokładnie polega ta technologia i jak działa? W jaki sposób wpływa na SEO? Tego i więcej dowiesz się z naszego artykułu.
Czym jest wyszukiwanie semantyczne?
Zanim przejdziemy do ogólnej definicji wyszukiwania semantycznego, zobacz pojęcie samej semantyki:
Semantyka to dział lingwistyki i logiki, który zajmuje się nie tylko logicznym znaczeniem komunikatów słownych, ale także analizuje ich przekaz oraz relacje w kontekście kulturowym, społecznym i sytuacyjnym.
Jak możesz się domyślić, dostrzeganie tego typu powiązań jest nieocenione w kontekście wyszukiwarek internetowych. Powiązanie tych dwóch dziedzin tworzy wyszukiwanie semantyczne, czyli technikę przeszukiwania danych, która wykorzystuje intencję i kontekstowe znaczenie stojące za wprowadzonym zapytaniem, aby dostarczyć trafnych wyników.
Ten zaawansowany proces interpretacji zapytań wykracza poza prostą analizę dopasowania słów kluczowych. Dzięki zastosowaniu naturalnego przetwarzania języka (NLP) oraz uczenia maszynowego (ML), wyszukiwanie semantyczne umożliwia głębsze zrozumienie dokładnych pytań i intencji użytkownika, które kryją się za układem słów kluczowych.
Czym jest wyszukiwanie frazami?
Wyszukiwanie frazami/słowami kluczowymi polega na zwracaniu wyników trzymających się powiązań:
- Słowo-słowo.
- Słowo-synonim.
- Słowo-podobne słowo.
Pierwsze wyszukiwarki internetowe korzystały wyłącznie z tej techniki. Z biegiem czasu wprowadzono w nich dodatkowe usprawnienia:
- Rozszerzanie zapytań – automatyczne wzbogacanie zapytania o synonimy lub pokrewne terminy w celu zwiększenia szansy na znalezienie trafnych wyników. Metoda szczególnie przydatna, gdy użytkownik używa słów o podobnym znaczeniu do tych, które występują w docelowo poszukiwanej treści;
- relaksacja zapytań – łagodzenie kryteriów wyszukiwania poprzez pomijanie niektórych słów z zapytania. Pomocne, gdy dokładne dopasowanie frazy nie przynosi oczekiwanych wyników;
- tolerancja błędnego zapisu – trafne rozpoznawanie wprowadzanego zapytania, nawet jeśli zawiera błędy ortograficzne, literówki, powtórzenia itp.;
- tokenizacja – proces rozdzielania tekstu na mniejsze jednostki, takie jak słowa czy frazy, aby ułatwić analizę i dopasowanie zapytań do treści;
- normalizacja – standaryzacja form słów do ich podstawowej formy, np. przekształcanie czasowników do formy bezokolicznikowej lub zamiana wielkich liter na małe.
Jak działa wyszukiwanie semantyczne?
Wyszukiwanie frazami oznacza znalezienie dokładnych lub zbliżonych dopasowań i jest wspierane omówionymi wcześniej technikami. Dla odmiany fundamentem wyszukiwania semantycznego są wektory, które pozwalają ująć słowa, zdania i całe dokumenty w formie numerycznej, co znacznie ułatwia ich analizę oraz porównywanie przez wyszukiwarkę Google.
Cały proces można ująć w następujących krokach:
- Reprezentacja semantyczna – każde słowo lub fraza w zapytaniu są przekształcane w wektor w przestrzeni wielowymiarowej. Punkty w tej przestrzeni reprezentują semantyczne znaczenie słów. Słowa (czyli teraz wektory) o podobnym znaczeniu mają zbliżoną długość oraz zachowują mały kąt między sobą (innymi słowy, są umieszczone blisko siebie). Dzięki temu sens słów kluczowych jest ujęty w matematyczny sposób.
- Dalsze przekształcanie w wektory – po wstępnej analizie zachodzą zaawansowane procesy konwertowania tekstu na wektory za pomocą rozbudowanych technik przetwarzania języka naturalnego. Są to np. Word2Vec, GloVe oraz modele oparte na transformerach (jak opracowany przez Google BERT czy ostatnio popularny GPT od OpenAI).
- Operacje na wektorach – gdy zapytanie jest już przekształcone w wektor, algorytmy przeprowadzają różne operacje matematyczne, takie jak obliczanie podobieństwa kosinusowego, aby zidentyfikować, które słowa, frazy i dokumenty są najbardziej związane semantycznie z zapytaniem użytkownika.
- Porównywanie z bazą danych – weźmy jako przykład indeks Google. Z technicznego punktu widzenia jest to ogromny zestaw dokumentów i stron w zapisie wektorowym. Dlatego wyszukiwarka semantyczna może użyć tzw. algorytmu k-najbliższych sąsiadów (kNN – k-nearest neighbor), by znaleźć te zestawy liczb, które najlepiej pasują do numerycznej reprezentacji zapytania. Dzięki takiej analizie łatwiej znaleźć najbardziej powiązane treści.
- Dobieranie najlepszej odpowiedzi – obliczając podobieństwa, algorytmy są w stanie precyzyjnie określić, które strony lub dokumenty najlepiej odpowiadają zapytaniu użytkownika. Za sprawą semantycznych słów kluczowych jest to możliwe, nawet jeśli źródło odpowiedzi nie zawiera dokładnych fraz użytych w zapytaniu.
Przykłady wyszukiwania semantycznego
Jak wyszukiwarka Google w praktyce uwzględnia kwestie wyszukiwania semantycznego? W jakich aspektach się poprawiła? Rozważmy kilka przykładów.
-
Intencja użytkownika
Na podstawie poniższego przykładu twórcy Google chcą zobrazować, jak dzięki wyszukiwaniu semantycznemu wyszukiwarka jest w stanie rozpoznawać niuanse językowe oraz pewne niepoprawne gramatycznie skróty myślowe.
„Czy można uzyskać leki dla kogoś apteka”
Google przez lata miało problem z rozpoznawaniem takich zapytań. Skupiało się głównie na sekcji „uzyskać leki” i zwracało wyniki dotyczące instrukcji, jak zrealizować receptę w aptece. Dla kontrastu wyszukiwarka semantyczna rozumie, że w grę wchodzi zrealizowanie recepty dla kogoś. Dodane na końcu urwane słowo „apteka” nie zmyla algorytmu, a raczej dostarcza dodatkowego kontekstu co do intencji użytkownika.
-
Ogólne pojęcia
Czasami wprowadzone słowa kluczowe nie dotyczą czegoś jednoznacznego, a raczej odnoszą się do ogólnej kategorii/pojęcia. Dzięki wyszukiwaniu semantycznemu Google jest w stanie rozpoznać, kiedy użytkownik ma coś takiego na myśli.
Przykładowo po wprowadzeniu zapytania „zdrowe desery” wyszukiwarka domyśla się, że chodzi o słodkie przysmaki, które są dobre dla zdrowia (np. zawierają wiele owoców). Google wie także, że jest to zapytanie kulinarne, dlatego w pierwszej kolejności zwróci przepisy:
-
Niepełne zapytania
Wyszukiwarka semantyczna będzie w stanie rozpoznać sens zapytania, nawet jeśli jest ono ułożone w niekompletny, lakoniczny sposób:
Google na podstawie 2 słów jest w stanie domyślić się, że chodzi o produkcje z serii Marvel Cinematic Universe i problem z tym, że wiele osób nie wie, jak podejść do ich oglądania.
Droga Google w kierunku wyszukiwarki semantycznej
Jak w ogóle doszło do tego, że Google stało się wyszukiwarką semantyczną? Oto najważniejsze daty dotyczące rozwoju tej technologii:
- zakup Freebase (2010) – Freebase to semantyczna baza danych stworzona przez Metaweb, która stała się podstawą dla pierwszej wersji Knowledge Graph;
- Knowledge Graph (2012) – Google wprowadza Knowledge Graph, który pozwala przedstawiać panele i karty wiedzy w wynikach wyszukiwania. Graf wiedzy Google strukturyzuje informacje i ustala relacje w tematycznych kontekstach;
- aktualizacja Hummingbird (2013) – to jeden z najważniejszych przełomów w kontekście wyszukiwania semantycznego. Dzięki temu update’owi algorytmy Google stały się znacznie lepsze w interpretowaniu zapytań i wykrywaniu rzeczywistej intencji użytkownika
- Knowledge Vault (2014) – Knowledge Vault to zaawansowany system, który pozwala zautomatyzować pozyskiwanie danych z nieustrukturyzowanych źródeł. Takie rozwiązanie stanowi podstawę w dalszym rozwoju przetwarzania języka naturalnego;
- implementacja maszynowego uczenia się z RankBrain (2015) – Google oficjalnie wprowadza uczenie maszynowe do wyszukiwarki za pomocą RankBrain’a, aby lepiej interpretować zapytania w kontekście intencji wyszukiwania i semantycznych powiązań;
- BERT (2018) – Google prezentuje BERT, czyli nową technologię, która ma usprawnić interpretowanie zapytań użytkowników i znaczenie analizowanego tekstu. W ciągu nieco ponad roku BERT stał się uniwersalnym punktem odniesienia w eksperymentach dotyczących przetwarzania języka naturalnego;
- MUM (2021) – Multitask Unified Model ma pomóc w lepszym semantycznym zrozumieniu zapytań i treści niezależnie od tego, czy stosowany jest format tekstowy, wideo, audio lub obraz.
Jak semantyczne wyszukiwanie wpływa na SEO?
Google to już od lat wyszukiwarka semantyczna. Jak więc postęp w zakresie rozpoznawania zapytań wpłynął na SEO? Przyjrzyjmy się najważniejszym kwestiom:
Ogólna poprawa jakości wyników wyszukiwania
Lepsze zrozumienie intencji użytkownika oraz niekompletnych lub ogólnych zapytań pozwala oczywiście zwracać lepsze odpowiedzi. Łatwiej dzięki temu znaleźć pożądane informacje. Oprócz tego korzystanie z samej wyszukiwarki jest przystępniejsze z perspektywy użytkownika. Nie musi on trzymać się sztywnych słów kluczowych, by uniknąć przypadkowego wprowadzenia algorytmów w błąd.
Więcej wzbogaconych wyników
Jak omówiliśmy wcześniej, z historią wyszukiwania semantycznego nieodłącznie związane są także inne inicjatywy jak chociażby Graf wiedzy Google. Dzięki równoległemu rozwojowi tych technologii, w wynikach wyszukiwania znacznie częściej pojawiają się właśnie grafy, wyróżnione fragmenty z odpowiedzią, sekcje dodatkowych pytań itp.
Lepszy i naturalniejszy content
Dzięki semantycznemu SEO twórcy treści internetowych nie muszą się skupiać na frazach kluczowych w takim samym zakresie jak wcześniej. Google znacznie lepiej radzi sobie z rozpoznawaniem synonimów i różnorodnych sposobów na ujęcie tych samych zagadnień. Przygotowywanie naturalnie brzmiącego i treściwego contentu stało się łatwiejsze.
Większy nacisk na intencję użytkownika i content
Kontynuując kwestię tworzenia treści, możliwość stosowania semantycznych słów kluczowych zmieniła to, jak należy myśleć o samym procesie pisania. Zamiast budować content wokół pojedynczych słów kluczowych, lepiej myśleć o szerszych tematach z danej niszy, uwzględniając przy tym główną intencję użytkownika.
Rozwój wyszukiwania głosowego
Zaawansowane wyszukiwanie głosowe nie byłoby możliwe, gdyby nie rozwój w zakresie wyszukiwania semantycznego. Zapytania wprowadzane głosowo zwykle są rozbudowane, zawierają wtrącenia i są ujęte w bardzo konwersacyjnym stylu. Dlatego stanowiłyby zbyt duże wyzwanie dla prostego dopasowywania fraz kluczowych.
Przeczytaj także:
Wyszukiwanie głosowe w Google – czym jest i jak korzystać?Podsumowanie
Oto najważniejsze informacje z artykułu:
- dzięki wyszukiwaniu semantycznemu Google jest w stanie lepiej rozumieć zapytania użytkowników. Zamiast zwracać odpowiedzi głównie na podstawie dopasowania fraz, algorytmy analizują znaczenie i kontekst;
- semantyczne wyszukiwanie sprowadza się do przekształcania słów w tzw. wektory. To na nich wykonywane są operacje matematyczne, które pozwalają ustalić znaczenie i powiązania tematyczne;
- rozwój wyszukiwania semantycznego przyczynił się do znaczącej poprawy jakości wyników wyszukiwania Google. Utorował także drogę wyszukiwaniu głosowemu.