Iedereen kent het wel, er wordt een goede vraag gesteld in een gezelschap en niemand weet echt wat het antwoord is. Zeker nu de smartphone binnen handbereik is wordt er al snel geroepen: “Google het anders even!”. Maar hoe kan het dat onze vraag zo snel en gemakkelijk beantwoord wordt?, en hoe doet Google dat dan?
Crawlen & indexeren
Voordat er überhaupt gezocht wordt door jou of mij heeft Google al het een en het ander gedaan. Door middel van Webcrawlers, ook wel bekend als een ‘Spiders’, doorzoekt Google het hele internet. Webcrawlers zijn software robots die webpagina’s vinden, deze gevonden webpagina’s worden vervolgens terug gestuurd naar Google.
Nadat al deze pagina’s gevonden zijn door Google begint Google deze te indexeren. Deze index is vergelijkbaar met een register in een boek, het geeft aan op welke pagina welke informatie staat. Aan de hand van deze index kan Google pagina’s koppelen aan zoekopdrachten.
Door vele updates is Google steeds beter geworden in andere relevante informatie te vinden. Een groot onderdeel hiervan is de ‘kenniskaart’. En wie kan er nou beter uitleggen hoe dit systeem werkt dan Google zelf?
Algoritmen
Algoritmen zijn processen en formules waarmee vragen, die op Google gesteld worden, omgezet worden naar antwoorden. Deze algoritmen die Google inzet maken gebruik van meer dan 200 unieke signalen om zo in te schatten waarnaar iemand opzoek is. Deze unieke signalen bestaan onder andere uit termen op websites, de recentheid van de inhoud, de regio waarin gezocht wordt en de PageRank.
Simpel gezegd, algoritmen zorgen ervoor dat jij vindt waarnaar je opzoek bent. Dit klinkt alleen veel makkelijker dan het is en Google heeft hier in de loop van de jaren flink aan gesleuteld om dit zo optimaal mogelijk te krijgen. Google is dan ook continu bezig om het zoekproces te verbeteren en door de jaren heen is het systeem aanzienlijk verbeterd. Deze evolutie van de website wordt schitterend uitgelegd in deze video.
Spam bestrijden
Spamsites proberen bovenin de zoekresultaten van Google te komen met diverse technieken zoals zoekwoorden vaak herhalen, links kopen met een hoge PageRank en onzichtbare tekst plaatsen op de website. Google wil dit voorkomen omdat het door deze acties geen relevante websites in beeld komen. Algoritmen van Google filteren de meeste spam en plaatsen deze automatisch naar lagere niveaus binnen Google. Alle overige spam wordt handmatig beoordeeld door speciale teams van Google.
Er zijn vele vormen van spamsites die Google onderscheid:
- Cloaking en/of verborgen omleidingen;
- Gehackte site;
- Verborgen tekst en/of overmatig gebruik van zoekwoorden;
- Geparkeerde domeinen;
- Pure spam;
- Gratis hosts en dynamische DNS-providers met veel spam;
- Beperkte inhoud met weinig of geen toegevoegde waarde;
- Onnatuurlijke links van een site;
- Onnatuurlijke links naar een site;
- Door gebruikers gegenereerde spam
Als je meer informatie wil over wat deze types van spam precies inhouden kun je terecht op deze website van Google.
Wat vinden we er van?
Google is terecht de marktleider van de zoekmachines. Waar de meeste zoekmachines lang stil hebben gestaan is Google altijd actief geweest met haar dienstverlening te verbeteren. Met name het beleid rondom spam zorgt ervoor dat websites die niet relevant zijn voor wat je zoekt ook niet op Google terecht komen. Je krijgt wat je zoekt!, wat wil je nog meer? Ik zou het niet beter voor kunnen stellen. En het mooie van alles is: Google is nog lang niet klaar. Ze blijven continu hun diensten verbeteren en meer relevante updates toevoegen.