Nya DN.se: Trevlig men ger HTTP 404 för div. nyckelord i "sökmotorvänliga URL:er"

2/25/2009

DN.se har byggts om och det ser ganska bra ut ヘ(^_^ヘ)(ノ^_^)ノ
Användbarheten upplever jag har ökat samtidigt som den nog är lite SEO-vänligare (mycket saknas dock). Det är skönt att slippa de gamla Polopoly-URL:erna:

www.dn.se/DNet/jsp/polopoly.jsp?d=3045&a=730618&viewAll=true

För mig är ändringarna DN.se gör och hur det fungerar lite intressant eftersom jag på sikt lär göra en motsvarande "portning" själv på en ganska bred sajt där en del saknas avseende defintion av hierarki via URL.

Gör man sådana stora förändringar smyger det sig för många ofta in lite små fel (händer mig ofta när jag gör saker åt mig själv). Och nedan har vi ett par från DN.se. Jag tror inte att de är till någon nackdel för DN.se och gissar att det löser sig av sig självt. De låg så kort tid i index.

DN.se ger HTTP 404 på många nya URL:er

Paradoxalt verkar det som att många nya sökmotorvänliga URL:er DN.se infört och som indexerats av Google ger HTTP 404 (d.v.s. DN.se säger att de inte går att hitta). Ett exempel bland många är:

www.dn.se/secondlife

Använd Google för hitta fler eller följa upp nuvarande status:

En del gamla polopoly-URL:er ger HTTP 04

Samma problem finns för några gamla polopoly-URL:er som:

www.dn.se/DNet/jsp/polopoly.jsp?d=3045&a=730618&viewAll=true

Andra sidor fungerar däremot korrekt t.ex.

dn.se/nyheter/vetenskap

Vilken går att nå via sajtens uppenbara navigering.

Vad är orsaken till problemen DN.se har?

Jag kan inte annat än gissa. Dessutom lade jag just ingen tid på det här. Om man tittat mer i Cache m.m. kanske man hade sett en tydlig förklaring man jag brydde mig inte i det. Rent generellt kan man kanske tänka sig följande som olika saker som i samband med en liknande ombyggnad kan ha orsakat sådant här:

  • Något form av mjukvara fel eller annan defekt i plattform.
  • Något manuellt som behöver göras p.g.a. tidigare fel och som nu tar tid.
  • Kanske införde DN.se ett tagg-system man tog bort eller som krashat.
  • Kanske tänkte man sig en bredare hierarki från början åtminstone från sitemap men ångrade sig och tog bort sidorna.
  • Kanske är det "blanksteget" (beskrivs sist) som stör och det är något man nu måste handeditera URL för URL?

Var det ett 1/2 taggningssystem?

Vi kan i vilket fall konstatera att dessa sidor hade sitt nyckelord "längst" in i URL närmast domänen. De passade med andra ord inte in i en hierarki utan beskrev egentligen bara nyckelordet för nyheten. Det behöver inte alls vara en dålig lösning om man kompletterar det med korslänkning för att beskriva hierarkier. Samtidigt blir det ju i praktiken något liknande ett taggningssystem genom att nyckelorden så att säga tar slut för vanliga ord om inte flera nyheter kan dela samma URL. I så fall verkar det vettigt att man inför ett riktigt taggningssystem där ju övriga delar saknas helt på DN.se.

En förklaring kanske var att DN.se från början tänkte sig att förutom unika URL:er för nyheterna i hierarkin även dublicera dem över alla relevanta nyckelord. Där kanske man ändrade sig när man insåg att sådana lösningar lätt blir problematiska om de inte är genomtänkta.

Hur är det med blankstegen?

Tittar vi på följande URL som Google indexerade för fyra timmar sedan ser vi ett underligt mellanslag:

    "www.dn.se/losningar/ "

Denna gör emellertid redirect till www.dn.se/webbspel/korsord/korsordslosningar-1.796206

Även andra URL:er går att hitta med mellanslag på slutet. Däribland denna som jag fick som första sökresultat på site:dn.se:

www.dn.se/%20
"AIK:arnas passion alldeles speciell"

0 kommentarer

Kommentera