Een Internetbezoeker die in 1997 een zoekmachine nodig had, zou tevergeefs zoeken naar Google. De populaire zoekmachine Google bestaat namelijk pas sinds 1998.
Hoe is dit bedrijf erin geslaagd in korte tijd de eerste plaats te bereiken onder de zoekmachines?
De grote kracht van Google schuilt in een slimme combinatie van hardware en software. Als hardware gebruikt Google geen waanzinnig dure supercomputers, maar een netwerk van duizenden goedkope PC's.
Maar de software van Google is het belangrijkste. Daar zit zoveel intelligentie in dat hij inmiddels in licentie door een aantal bedrijven gebruikt wordt.
Als je in een zoekmachine het woord klompen intikt, verwacht je adressen te vinden waar je klompen kunt kopen, waar klompen worden gefabriceerd, of misschien verwacht je informatie over een klompenmuseum.
Wat je waarschijnlijk echter niet verwacht is een artikel waarin wordt vermeld dat tijdens een braderie te Drachten een klompendans werd uitgevoerd, of dat bij de laatste overstroming van de Waal klompen klei van de dijk gespoeld werden.
Hoe weet een computerprogramma nou dat je niet naar die laatste twee gevallen zoekt? Een heel primitieve manier om de relevantie van een woord in een tekst te bepalen zou erin kunnen bestaan dat je telt hoe vaak het gezochte woord in de tekst voorkomt. Deze verouderde techniek, die door sommige oudere zoekmachines werd gebruikt, werd nogal eens misbruikt: sommige sites vermeldden de zoektermen waar ze op gevonden wilden worden in een onzichtbare kleur honderden malen onder de reguliere tekst van de site.
De manier waarop de programma's bij Google bepalen hoe relevant woorden in een tekst zijn, heeft met de hierboven geschetste 'techniek' heel weinig te maken.
Het algoritme (zo noemt men de manier waarop een computerprogramma werkt) van de zoekprogramma's van Google wordt Page Rank genoemd. Het principe heeft enige overeenkomst met democratische verkiezingen. Als veel webpagina's naar webpagina A verwijzen, wordt de page rank van pagina A groter.
Maar de page rank van pagina A hangt ook weer af van de page rank van de verwijzende pagina's. Zo zal pagina A hoger scoren als ernaar verwezen wordt door de webpage van The Times dan dat hiernaar verwezen wordt in Tom Luifs Homepage, tenminste, daar gaan we voorlopig nog maar even van uit.
Daarnaast gebruikt Google zeer geavanceerde technieken om de relevantie van woorden in een tekst te onderzoeken. Over de details van deze technieken is maar weinig bekend.
Google rust niet op zijn lauweren: voortdurend proberen de tientallen ingenieurs van Google dit proces te verfijnen.
Doordat het zoekproces volledig is geautomatiseerd, is het vrijwel onmogelijk de page ranking van buitenaf te beïnvloeden. Ook accepteert Google geen geld als ruil voor een hogere page-ranking.
Terug naar homepagina.