Google RankBrain: Fabels en de feiten
Wanneer je werkzaam bent in wereld van (online) marketing, is het je vast bekend: Google RankBrain. Dit zelflerende systeem werd gelanceerd in oktober 2015 en functioneert als een soort filter waarmee zoekopdrachten beter kunnen worden geïnterpreteerd door Google. Woorden, zinnen en grotere groepen tekst worden gescand door middel van verschillende algoritmen, om zo beter te kunnen bepalen wat deze informatie, ingetikt door de bezoeker, betekent, en in welke context Google deze vervolgens dient te plaatsen. Zo wordt een optimaal zoekresultaat gevormd op basis van de door de gebruiker ingevoerde query (zoekopdracht). Dit artikel gaat dieper in op de achterliggende systematiek die gebruikt wordt door RankBrain, en legt je tevens de waarheid uit over veelgehoorde fabels en feiten omtrent dit systeem.
Werking machine learning
Om beter te kunnen begrijpen hoe RankBrain precies werkt, is het van belang om de stappen die het machine-leersysteem gebruikt beter te bekijken. Het proces begint met een data-analyse: hiermee wordt een algoritme gecreëerd. RankBrain verbetert hiermee, simpel gezegd, de taalvaardigheid van Google voor wat betreft het stuk tekst wat wordt onderzocht.
De tweede stap die RankBrain volgt is het toepassen van dit algoritme op nieuwe data-sets. RankBrain analyseert de inhoud en betekenis van de door de gebruiker ingevoerde zoektermen, en vindt hiermee documenten en bestanden die relevant zijn voor deze zoekopdracht.
Bovenstaande kan beter worden uitgelegd door middel van een voorbeeld: wanneer men in de zoekopdracht het woordje “zonder” zou gebruiken, bijvoorbeeld “Kan ik zonder het gebruik van een walkthrough een maximale score behalen in een missie in de game GTA-5?” Het “oude” Google zou deze zoekopdracht vervolgens verwerken zonder acht te slaan op het woordje “zonder”. Maar dit is uiteraard precies wat de gebruiker niet wil weten. Met de implementatie van RankBrain is de verwerking van dit soort zoekopdrachten sterk verbeterd: het woordje “zonder” wordt meegenomen op basis van de context, en zorgt zo voor een meer accuraat zoekresultaat. Door Stone Temple is begin 2016 een onderzoek gedaan om de impact van RankBrain te meten: zoekresultaten uit juli 2015 werden vergeleken met die uit januari 2016. De conclusie hieruit was, dat RankBrain in zo’n 56% van dit soort zoekopdrachten de resultaten verbetert.
Bovenstaande uitleg kan reden geven tot bepaalde aannames en onwaarheden over RankBrain die worden gezien als zijnde waarheid. Hieronder geef ik een uitleg bij bepaalde fabels en feiten die over RankBrain de ronde doen.
Google gaat intenties beter begrijpen
Ten eerste is het niet zo dat RankBrain de manier waarop Google informatie interpreteert, verandert. Alle algoritmen zoals Google deze kent voor bepaalde links, content of andere relevante zaken worden niet veranderd. Wat RankBrain wél doet, is het verbeteren van de interpretatie van zoekopdrachten, om hier vervolgens vaak een beter resultaat aan te koppelen. We kunnen dit onder meer illustreren aan de hand van de volgende zoekopdracht. Wanneer we zoeken naar “kaart Utrecht Oudegracht” zoals Google dit in januari 2015 zou weergeven, krijgen we het volgende resultaat:

Google negeert het woord “kaart”, en geeft willekeurige informatie over de binnenstad van Utrecht. Wanneer we dezelfde zoekopdracht uitvoeren in Augustus 2016, zien we dit resultaat:

Een netter resultaat, inclusief kaart, precies wat de zoeker wil zien. De algoritmen zijn hierbij niet veranderd, maar de link tussen de zoekopdracht en de resultaten is verbeterd: Google begrijpt in dit geval beter wat de bedoeling is van de zoekopdracht.
Menselijke input niet meer nodig?
De tweede fabel is het geloof dat automatisch gegenereerde algoritmen beter zijn dan algoritmen welke zijn opgezet door mensen. Natuurlijk is het zo dat geautomatiseerde processen veel werk van mensen uit handen nemen, maar hier staat tegenover dat ieder machine-gestuurd systeem een uitgebreid traject aan testen en verificaties moet ondergaan, voordat het als 100% functioneel kan worden beschouwd. Hiernaast zijn mensen nog altijd nodig om te bedenken welke algoritmen er moeten worden getest. In een omgeving welke puur machine-gericht is, zouden mensen ook voor wat betreft dit proces aan de kantlijn komen te staan. Gezien de complexiteit van algoritmen, en de verborgen fouten die door machines niet altijd opgemerkt kunnen worden, kunnen we stellen dat volledig machine-gestuurde zoekprogramma’s voorlopig nog tot de toekomst behoren en search specialisten voorlopig niet zonder baan zullen komen te zitten.
Bovenstaande beweringen zijn hoofdzakelijk gebaseerd op een gesprek wat, in maart 2016, is gehouden tussen Andrey Lipattsev van Google en WebPromo expert Anton Shulke. In deze Google Q and A, die je in zijn volledigheid hier kunt bekijken, komt RankBrain uitgebreid aan bod. We leren hieruit onder meer dat RankBrain vandaag de dag het op drie na belangrijkste middel is wat bijdraagt aan zoekresultaten van Google, na uiteraard de belangrijkste twee: content en links naar een site. Maar RankBrain past niet per se de volgorde van deze eerste twee aan: het zorgt er slechts voor dat de samenhang van deze factoren voor de bepaalde zoekopdracht tegen elkaar worden afgewogen, en zo samen beter in context kunnen worden geplaatst. RankBrain past dus niet de basis-rankings aan, maar brengt een zoekresultaat naar voren wat beter past in de context van de zoekopdracht zelf.
Relevantere zoekresultaten door beter begrip context
Samengevat is de voornaamste functionaliteit van RankBrain het beter laten begrijpen van zoekopdrachten door Google, om zo de resultaten beter te laten matchen met de zoekopdracht. Dit betere begrip van de zoek-query kan er soms toe leiden dat er een ander algoritme door Google wordt geselecteerd dan er in eerste instantie zou worden gedaan. Het is dus niet zo dat RankBrain ervoor zorgt dat er een geheel nieuw algoritme wordt toegepast: het zorgt er in sommige gevallen wellicht wél voor dat er een andere combinatie aan algoritmen wordt gebruikt. De basis ranking-algoritmen worden door RankBrain niet aangeraakt: content en inkomende links zijn nog steeds van het grootste belang voor de uiteindelijke zoekopdracht. Wat RankBrain dus doet, is het beter begrijpen van de context waarin, en de samenhang tot, de factoren van de zoekopdracht, om zo tot een optimaal resultaat te komen.

