Ordsky med LSIer

Ordene du må bruke i tillegg til søkeordet

Søkemotoroptimalisering av tekster handler ikke bare om selve søkeordet. Det er også andre ord som bør med i teksten. Her kan du lese om hvilke – og hvordan du finner dem.

De fleste innholdsprodusenter har skjønt det nå: Innholdsmarkedsføring bør optimaliseres for et viktig søkeord eller -frase.

Hvis søkefrasen er «severdigheter i London», skriver du en guide til nettopp det: De beste og viktigste severdighetene i London. Og passer på å bruke søkefrasen mange nok ganger til å tilfredsstille søkemotorens algoritmer.

Det fine – for leserne og bedrifter som faktisk ønsker å hjelpe sine potensielle kunder – er at selve søkefrasen ikke lenger trenger å gjentas så ofte.

På den annen side er søkeordet som regel ikke lenger tilstrekkelig til å rangere med siden.

I tillegg må også en del andre ord eller fraser med i teksten. I mine skrivekurs om SEO-vennlige tekster har jeg litt feilaktig valgt å kalle dem LSI-er (LSI står for «latent semantic indexing»). Når jeg sier litt feilaktig, er det fordi Google bruker andre metoder, som TF*IDF. I resten av dette innlegget vil jeg kalle den «semantisk relaterte ord».

I dette innlegget kan dere lese om:

  • Hva semantisk relaterte ord og TF*IDF er
  • Hvorfor søkemotorene bruker syntaktisk relaterte termer
  • To nyttige verktøy for å finne gode relaterte termer til ditt tema

Forskjellen på relaterte ord og søkeord

Med semantisk relaterte ord mener jeg kjapt forklart et ord som er nær relatert til søkeordet uten å være et synonym.

I eksempelet ovenfor vil «turistattraksjoner» og «ting å se» være synonymer. De bør selvfølgelig også være med i teksten – både for å få naturlig flyt og å fange opp søkefraser. Men hva er da de semantisk relaterte ordene?

For å forstå det, må vi forstå hvordan Google og andre søkemotorene virker. De skanner millioner av sider og vurderer innholdet ut fra algoritmer. Samme teknikk må også brukes til å finne nær relaterte ord, på denne måten:

Søkemotorene ser hvilke ord andre sider om samme tema, inneholder.

Dette resulterer i en TF – term frequency – altså et mål på hvor ofte bestemte andre ord forekommer i teksten. Denne frekvensen sammenlignes da med IDF – Inverse Document Frequency – altså hvor mange andre sider som bruker ordet. Den siste manøveren sørger for å sile bort alle «standardord» som «er», «som», «har» eller «Lik på Facebook» – hensikten er jo å legge vekt på de ordene som faktisk sier noe om sidens relevans og kvalitet.

Google har faktisk tatt patent på en slik teknologi. I patentbeskrivelsen forklarer de at patentet «identifiserer fraser som er beslektet med hverandre, basert på en frases evne til å forutsi tilstedeværelsen av andre fraser i et dokument». (Min oversettelse)

Et annet Google-patent går mer spesifikt til verks i å antyde noe som minner sterkt om FT*IDF.

Hvorfor semantisk relaterte ord er viktige

I den førstnevnte patentbeskrivelsen nevner Google også et konkret eksempel, som illustrerer begrepet godt: «President of the United States» og «White House».

For søkemotorene er det viktig å kunne bedømme søkeresultater utfra slike beslektede fraser av to grunner:

  1. En del søkeord kan bety helt forskjellige ting. Tinder kan være både en app og en betegenelse for spisse fjelltopper. Og Mars er (blant annet) både en planet og en populær sjokolade. Søkemotorene må derfor ty til støtteord for å forstå hvilken av betydningene siden handler om.
  2. Søkemotorene har som mål å foreslå best mulig innhold for brukerne. Derfor ønsker de – selvfølgelig – å prioritere sider som gir «kjøtt på beinet». Antall ord kan være en faktor i denne vurderingen. Men hva disse ordene er, altså innholdet, er viktigere for leseren.

Hvis vi ser på eksempelet fra Googles patentbeskyttelse, og legger til «Donald Trump», blir hensikten med å bake inn beslektede fraser i algoritmen, tydelig:

Det er umulig å forestille seg en god side om USAs president som ikke nevner navnet hans. Det vil også være rart hvis den ikke forteller at han holder til i verdens mest kjente presidentbolig.

Verktøyer for å finne relaterte ord

For en del søkeord gir de viktigste semantisk relaterte ordene seg nærmest selv. Du må bare tenke gjennom hvilke ord du selv vil forvente av en god artikkel om temaet.

For andre søkefraser er det mindre intuitivt. Da kan du selvfølgelig gjøre googlesøket selv, og gå manuelt gjennom ordene som går igjen. Men dette tar uforholdsmessig lang tid, og medfører en fare for at også selve teksten du til slutt skriver, blir mindre original enn den du egentlig brygget på.

En rekke såkalte LSI-verktøyer gjør lite annet enn å liste opp longtail-muligheter som du heller bør finne (på en langt bedre måte) med en skikkelig søkeordsanalyse.

Jeg har imidlertid funnet to gratisverktøyer som faktisk gjør det de lover:

  • Niche Laboratory er en nettside som automatisk skanner de øverste Google-treffene for ditt søkeord, for deretter å liste dem opp. Verktøyet finner norske ord, men det er ikke mulig å sortere på språk. Dermed kan det bli mye støy fra sider på engelsk, tysk og så videre hvis søkeordet heter det samme på flere språk. Den lister også kun opp ett og ett ord, slik at Donald og Trump vil stå hver for seg, potensielt med mange andre urelaterte ord innimellom. Det siler vekk noen standardord men ikke alle.
  • Ultimate Keyword Hunter krever at du laster ned et program til datamaskinen. Til gjengjeld er det mulig å velge domeneområdet .no, og du kan få opp lister over fraser med flere ord. Du får også en ordtelling over hvor mange ganger hver enkelt frase forekommer, og velge bort eventuelle sider som du ikke er interessert i. Det siste kan være nyttig hvis et av topp-10-resultatene bruker samme ord ekstremt mange ganger. Dessverre fungerer programmet bare til MS Windows. Det siler heller ikke vekk noen standardord (men du kan gjøre det selv).

Med begge verktøyene vil du måtte gjøre en manuell vurdering til slutt. Men de er et godt redskap for å komme opp med de viktigste ordene Googles patent ser etter.

Et praktisk eksempel

Her har jeg kjørt søkeordet fra starten av blogginnlegget, «severdigheter i London», gjennom de to verktøyene.

LSI-er til et søkeord hentet fra verktøyet Niche LaboratorySkjermdumpen fra Niche Laboratory viser forslagene den kommer opp med. Som dere ser, er det mange reelle attraksjoner på listen – vel å merke stykket opp på en måte som gjør den vanskelig å lese. For eksempel står «madame» på linjen under «tussauds» og ordene «kensington» og «garden» på henholdsvis linje 2 og linje 4.

Etter et kjapt manuelt utvalg gir Ultimate Keyword Hunter denne TF-lista: (Den kunne ha vært kortere eller lengre, avhengig av mitt utvalg.)

«landemerker, Westminster, attraksjoner, billetter, Themsen, reisetips, Greenwich, steder, teater, musikaler, bestillingsalternativ, Buckingham Palace. Tower Bridge, Madame Tussauds, Trafalgar Square, nærmeste undergrunnsstasjon, Westminster Abbey, Covent Garden, Leicester Square, Hyde Park, historiske steder, Cutty Sark, Notting Hill, South Kensington, Oxford Street, severdigheter og landemerker, gjøre i london, Tower of London, Victoria and Albert Museum, Kensington and Hyde Park.

Som dere ser, foreslår verktøyene både gode synonymer og en rekke elementer som vil gjøre artikkelen din bedre. For Google, og – enda viktigere – for leserne dine.

LSI-er til søkeord på Ultimate Keyword Hunter


Innholdsrådgiver Gjermund Glesnes

Gjermund Glesnes

Innholdsrådgiver

gjermund.glesnes@cloudmedia.no