Enligt Google Webmaster tools ser den automatiskt skapade robots.txt för bloggar på Google Blogger ut så här:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Noindex: /feedReaderJson
Sitemap: http://www.pryltrend.com/feeds/posts/default?orderby=updated
Det här (så vida jag nu inte tolkar det fel i vilket fall det givetvis är strålande om någon påpekar det i kommentarerna) innebär att för alla sidor på Google Blogger (även med egen domän) som innehåller search är disallow för Google. Detta berör primärt (men inte uteslutande):
1. Labels (etiketter / taggar). Ex:
www.pryltrend.com/search/label/Underlig%20mat
2. Sidor som skapats via search?. Ex:
www.pryltrend.com/search?updated-max=2008-12-21T14%3A31%3A00%2B01%3A00&max-results=10
Hur tolkar Google disallow?
Disallow förbjuder sökmotorn att besöka sidan åtminstone enligt robotstxt.org:
"The value of this field specifies a partial URL that is not to be visited."
Från: A Standard for Robot Exclusion
Datum: 2008-12-26
Enligt analysverktyget i Google Webmaster tools ser Google ut att respektera detta (klicka på bilden för förstoring):
Hur hanterar Google externa inlänkar till sidor som är disallow?
Det är en väldigt bra fråga. Eftersom Google inte kommer läsa sidan innebär det åtminstone följande:
- Inlänkar (från andra webbplatser) kan ge inte positivt påverka ranking alls av undersidan eftersom den inte alls är med i index.
- Interna länkar på den sida som är disallow kan inte sprida kraften vidare eftersom Google inte besöker sidan.
Givetvis kan man tänka sig att Google kanske tar kraften och för över till startsidan eller dyligt. Men jag känner inte till någon som föreslagit att så sker eller något uttalande från Google som pekar på det. Jag är väldigt tveksam till att så sker.
När det blir det här ett problem?
Det här är knappast något större problem när det kommer till externa inlänkar eftersom sidor man har satt disallow på knappast (om man inte är dum) hör till sådant som får inlänkar. Däremot kan det kanske vara ett problem med interna länkar. Det vore givetvis bra om Google struntade i att föra över länkokraft när interna länkar går till sidor som är disallow men vi vet egentligen inte om det så sker. Så vitt jag vet har ingen försökt testa det här och jag känner inte till något uttalande från Google.
Därför verkar det väldigt klokt att ha sådana länkar satta med rel=nofollow. Inte heller kan du förlora något på detta eftersom målsidorna inte kan indexeras.
Hur skapas länkarna i koden för Google Bloggers standard layout:er?
Det ser ut som nedan eller något ungefär jämförligt:
OBS här och ev. senare också har jag använt C-kommentarer innanför section. Det går inte utan där ska det vara html-kommentarer eftersom allt innanför section antingen evalueras till html eller direkt skrivs ut. Jag gjorde en kommentarer till postningen om hur du skriver html-kommentarer.
/* Gå igenom alla labels som är satta för inlägget i tur och ordning. */
<b:loop values='data:post.labels' var='label'>
/* Skapa en länk till archive-sidan för aktuell label. */
<a expr:href='data:label.url' rel='tag'><data:label.name/></a>
/* Om det inte är sista label skriv ut ett , mellan respektive länk till label. */
<b:if cond='data:label.isLast != "true"'>,
</b:if>
</b:loop>
Här ser vi att länkarna blir motsvarande:
<span class='post-labels'>
Etiketter:
<a href='http://www.seotaktik.com/search/label/Google%20Blogger' rel='tag'>Google Blogger</a>
</span>
De är med andra ord inte rel=nofollow. Däremot har de fått rel satt till tag.
Vad är rel='tag'?
Hur Google exakt hanterar rel='tag' (om överhuvudtaget) bör spegla standarden. En lika bra beskriven av vad rel='tag' betyder som någon annanstans ges av Doctype. Doctype finns på code.google.com och beskrivs som:
"Doctype is a Google-sponsored open encyclopedia and reference library for developers of web applications. By web developers, for web developers."
Där definieras rel='tag' enligt:
"The rel="tag" attribute indicates that the tag that the referenced document represents applies to the current document.
rel="tag" is one of several link types for describing relationships between documents."
Från: RelTagAttribute (code.google.com)
Datum: 2008-12-26
En länk markerad rel="tag" är med andra ord inte alls avsedd för att beskriva den sida som länken går till. En länk markerad rel="tag" är istället avsedd för att beskriva vad sidan där länken finns handlar om. Det är ju väldigt logiskt och vettigt. Att Google tar hänsyn till rel="tag" som en beskriven av aktuell sida håller jag för troligt för sajter som är betrodda på en viss nivå. Att Google själva ganska ofta använder rel="tag" pekar eventuellt också på det. För nya sajter och sajter i vissa typer av filter tror jag inte att något författar-styrt värderas alls eller mycket litet oavsett om det är rel="tag" eller något annat.
Hur förs länkokraft över vid rel="tag"
Givetvis är det inte orimligt att Google hanterar den länkokraft som överförs med sådana länkar annorlunda. Att många taggsidor numera rankar mycket sämre än förr är något som åtminstone tydligt pekar på detta. Jag har också fått för mig att sajter som utnyttjar rel="bookmark" (som är något helt annat än rel="tag") inte försämras i ranking lika mycket (men jag kan ta fel och har inte försökt följa det medvetet). Det här behöver dock inte innebära att länkokraft inte förs ut precis som vanliga eller i viss utsträckning vid rel="tag" men sedan devalveras även när sidan med labels inte har disallow.
Vi vet inte säkert exakt vad som gäller. Jag har inte läst om någon som undersökt det eller något uttalande från Google. Särskilt gäller det vid interna länkar markerade tag. Att du använder tag för att peka ut att aktuell sida handlar om nyckelordet i ankartext behöver ju trots allt inte innebära att sidan du länkar till inte är något som ska ranka. Det behöver ju inte alls vara en sida med dublicerat innehåll utan kan tänkas vara något (om än inte mindre vanligt) en såda med en handskriven sammanfattning och länkar till utvalda nyheter och artiklar på temat. Vidare rent generellt vid intern länkning har den gamla PR algoritmen mycket stor betydelse (menar åtminstone jag) för fördelning av kraft. Om det berör rel="tag" vet jag inte men jag skulle inte bli helt förvånad.
Så vad ska vi göra? Bör man ändra något?
Jag kan inte se någon anledning till varför man inte skulle ändra koden till Google Blogger så länkarna till label-sidor är markerade rel=nofollow. Varför skulle du ta risken att slösa bort något när du helt säkert inte får ut något av det? Men tappar vi då inte det ev. värde som rel=tag har? Jag har ytterst svårt att tro det eftersom det ena inte utesluter inte det andra enligt standarden:
"rel = link-types [CI]
This attribute describes the relationship from the current document to the anchor specified by the href attribute. The value of this attribute is a space-separated list of link types."
Från: Links (www.w3.org)
Datum: 2008-12-26
Vi kan med därför inkludera både nofollow och tag. Exempelvis kan vi ändra koden till:
<a expr:href='data:label.url' rel='nofollow tag'><data:label.name/></a>
Det gör nu att Google Blogger istället genererar följande html (eller motsvarande för aktuell tagg och webbplats):
<a href='http://www.seotaktik.com/search/label/Google%20Blogger' rel='nofollow tag'>Google Blogger</a>
Jag införde det precis på SEOTaktik.com eftersom jag så smått funderar på att börja använda labels. Närmast därför jag börjat göra en anpassning av labels till Pryltrend.com jag gillar bättre än hur det vanligen fungerar med Google Blogger.
Behöver man ändra något mer?
Ja det kan mycket väl finnas andra interna länkar som går till label-sidor. Typiskt finns ett antal widgets som länkar label-sidor sökmotorvänligt. Dessa behöver inte ens alltid ha rel="tag" satt. Det tagmoln jag använder på Pryltrend.com fick jag t.ex. skriva om så att länkarna blev rel="nofollow". Där eftersom taggmolnet syns över hela sajten och inte har något med de enskilda bloggpostningarna att göra ska länkarna givetvis inte ha med tagg i rel utan uteslutande nofollow.
Ungefär samma sak kan säkert beröra många fler plattformar än Google Blogger.
Kommentera