Google berättar lite om ranking & spam

5/29/2008

Den här bloggpostningen på "The Official Google Blog" bör vara små intressant läsning för många:

Den ger ett intryck av hur Google tänker kring sökkvalitet. Även en del specifik information ges fast här måste man naturligtvis tänka på det Google själva understryker:

"For something that is used so often by so many people, surprisingly little is known about ranking at Google. This is entirely our fault, and it is by design. We are, to be honest, quite secretive about what we do."

Google, ranking och pagerank
Intressant är givetvis att Google diskuterar hur ranking beslutas. Pagerank sägs fortfarande användas men som de flesta redan vet är det bara en del av ett mycket större system. Faktorer Google pekade ut som exempel i bloggpostningen var:

1. Språk.
1.1. Förmåga att hantera fraser.
1.2. Synonymer.
1.3. Diakritiskt tecken.
1.4. Stavfel.

2. "Query models."
Frågemodeller kanske är en riktig översättning? De förklarar vad de menar med att det inte längre bara är språket utan hur folk använder det.

3. Tidsmodeller.
Vissa frågor besvaras bäst med en färsk artikel medan annat bäst möts med ett äldre dokument med förtroende ("stood the test of time").

4. Personalisering.
Anpassning mot enskilda användare.

Uppföljning av kvalitet
Automatiserade evalutioner sägs ske varje minut för att se till att inget går fel. Periodvis sker djupare evalutioner för övergripande kvalitet. Dessutom görs tester av enskilda förändringar i algoritmen.

Under 2007 uppges 450 nya förbättringar ha skett (nio per vecka i genomsnitt). Däribland förändrades PageRank i januari:

"In 2007, we launched more than 450 new improvements, about 9 per week on the average. Some of these improvements are simple and obvious -- for example, we fixed the way Hebrew acronym queries are handled (in Hebrew an acronym is denoted by a (") next to the last character, so IBM will be IB"M), and some are very complicated -- for example, we made significant changes to the PageRank algorithm in January."

Relevans och Google
De flesta förändringar uppges avse förbättringar avseende relevans. Relevans är också något jag alltid upplevt att Google prioriterat hårt. Ett sökresultat ska ha hög relevans och visa det användaren behöver ha. Där tycker jag att de presterar bättre än konkurrenterna.

Vilka förändringar kommer vi se?
Google skriver också att mer information kommer att ges. Något de troligen inte kommer kommentera är vad de arbetar på just nu. Mitt intryck är att flera förändringar testas just nu.

En målsättning hos Google tror jag är representativ bredd d.v.s. att sökresultat ger en representativ bredd och inte säger samma sak. Ett sådant sökresultat bör givetvis vara mer värt för användaren. Google Universal Search kan man se som en satsning på det. Inom telekommunikation finns ju förövrigt begreppet Diversity scheme som kanske är lite jämförbart. Kanske är det här som de gör förändringar just nu?

0 kommentarer

Kommentera