Google: Infrastruktur idag och Strategi för framtiden

1/01/2009

Med den här bloggpostningen inleds en artikelserie där vi tittar på Googles strategi genom att undersöka:

  • Nätverk och infrastruktur övergripande (data center, appservrar, CDN-servrar, partnernät, peering m.m.) idag.
  • Satsningar de gör inför framtiden.
  • Deras arbete med CDN (Content delivery network).
  • Sådant som framgår via code.google.com. Vad säger oss t.ex. Chrome?
  • Vissa patentansökningar.
  • Strukturering de gjort av vissa applikationer (t.ex. standard layout för Google Blogger).
  • Uttalanden de gör på bloggar, föredrag m.m.

Detta är i sig väldigt intressant för alla som vill förstå Google. Nästan plågsamt mycket information blir snabbt tydlig när man går vidare och försöker bedöma bakomliggande övergripande strategi för internet som Google nu investerar sin framtid i.

Att förstå den strategi Google satsar på

Den här artikelserien är en del av ett större projekt där jag tittar på Google:s infrastruktur, möjligheter de ger till integration och deras strategi för framtiden. I det projektet ingår även en serie bloggpostningar där jag praktiskt undersöker möjligheterna att integrera en blogg så långt som möjligt med de tjänster, API:er m.m. Google gör tillgängligt (se Google Code). Där använder jag en egen blogg på Google Blogger som exempel: www.pryltrend.com.

Den artikel serien finns samlad här: Google Blogger (SEOTaktik.com). Och mer kommer allt eftersom jag lär mig något nytt och lägger till det på bloggen själv!

1. Viktiga begrepp / Ordförklaring

Innan vi går vidare och ritar upp Google:s infrastruktur, nätverk och strategi behöver några generella begrepp förklaras. Krävs senare i artikelserien att fler begrepp förklaras kommer också de införas här.

Begreppen som nu har förklarats speglar p.s.s. de närmaste bloggpostningarna. Då kommer vi titta bl.a. på Google Global Cache, Google DNS, GGC-noder, Data center (DC), Google App Engine och en hel del mer som har med Content Distribution Networking (CDN). Det kräver att vi nu förklarar följande begrepp:

    1.1. OpenID
    1.2. The Cloud / Molnet
    1.3. Content delivery network
    1.4. Peering och Internet exchange point
    1.5. Geolocation och IP2Geo

1.1. OpenID

OpenID är en öppen decentraliserad standard för identifikation av användare. Genom OpenID blir det möjligt att logga in på många tjänster på nätet (i "molnet") genom att använda samma digitala identitet. Google verkar satsa tydligt på OpenID. Andra större aktörer som engagerar sig på olika sätt är IBM, Microsoft, Sun, VeriSign och Yahoo!.

Läs mer:

1.2. The Cloud / Molnet

Vad man menar med The Cloud förklaras väldigt bra i Wikipedia:

The cloud is a metaphor for the Internet, based on how it is depicted in computer network diagrams, and is an abstraction for the complex infrastructure it conceals. It is a style of computing in which IT-related capabilities are provided “as a service”, allowing users to access technology-enabled services from the Internet ("in the cloud") without knowledge of, expertise with, or control over the technology infrastructure that supports them. 'Cloud Computing is a paradigm in which information is permanently stored in servers on the Internet and cached temporarily on clients that include desktops, entertainment centers, tablet computers, notebooks, wall computers, handhelds, sensors, monitors, etc.'
Från: Cloud computing (en.wikipedia.org)
Datum: 2009-01-01

Viktiga frågor inför kommande delar i artikelserien är vilka förändringar detta kräver i nätets och Google:s infrastruktur och hur det påverkar IT- och informationssäkerhet. Och hur påverkar det användarna?

Mer att läsa om the Cloud:

1.3. Content delivery network

Ett content delivery network (CDN) eller content distribution network (CDN) är en lösning för att snabba upp internet. Google:s Youtube.com är ett bra exempel på man vad man uppnår med ett CDN. Youtube.com skickar filmklipp till besökare av sajten. Ett populärt filmklipp kan få ett mycket stort antal besökare under kort tid. Filmklippen är dessutom jämfört med nästan allt annat surfare vanligen besöker väldigt stort. Utan CDN kommer en kopia av filmklippet skickas till varje besökare som vill se det. Resultatet blir att massor av bandbredd går ut vid Youtube.com webbservrar vilket gör det slött även för alla övriga besökare. Dessutom kommer alla kopior av filmklippen äta upp bandbredd ute hos ISP:erna och mellan dessa och Youtube.com.

Ett content distribution network (CDN) fungerar på så sätt att servrar placeras ut lokalt hos viktiga ISP:er. T.ex. när den första användaren hos en ISP efterfrågar ett filmklipp kan det sparas lokalt i dessa servrar. När nästa hos samma ISP efterfrågar samma filmklipp går nedladdningen mycket snabbt eftersom filmklippet redan finns "lokalt". Olika smarta algoritmer går att tänka sig. Kanske sparas en lokal kopia av ett filmklipp hos alla CDN-servrar när det börjar bli populärt?

Så här långt är lösningen egentligen inte särskilt märkvärdig. ISP:er har också själva haft liknande lösningar för att minska sin belastning. Ofta används en web proxy som t.ex. Squid som fungerar som cache. Ett content distribution network (CDN) behöver i princip heller inte göra mer än detta på en egen server men vanligen finns dessutom snabbare nätverksförbindelse mellan den lokala CDN-servern och nätverket där de "riktiga" innehållsservrarna finns. Eftersom ISP:ernas lokala nätverk ofta är väldigt snabba kan man genom detta uppnå fantastisk prestanda för surfarna även för webbsajter som är väldigt krävande och annars hade varit brutalt slöa.

1.4. Peering och Internet exchange point

Peering är frivillig anslutning mellan olika nätverk på internet. Det innebär att de kan börja dela trafik mellan varandra. Desto mer peering ett nätverk har (givet att deras hårdvara klarar av det) ju bättre (men dyrare) är det att vara kund där:

Orsaken till det är att ju bättre anslutna nätverket är till övriga desto kortare väg behöver trafiken du skickar och tar emot gå för att nå målet. Det blir snabbare att surfa.

Förutom att nätverken är fysiskt anslutna till varandra krävs att man delar information om routing. Routing information är den information som krävs för att entiteterna i nätverket ska veta var de ska skicka information. Det protokoll som används för det är Border Gateway Protocol (BGP).

Information om olika aktörers peering kan hittas via:

Logga in med guest guest. Du kan sedan gå vidare och titta t.ex. på den peering Google uppger att de genomför:

Hur en aktör av den typ Google är genomför peering säger åtminstone något om vad de prioriterar.

En Internet exchange point (IX eller IXP) är fysisk infrastruktur som tillåter olika ISP:er (Internet service providers) att byta trafik mellan varandras nätverk. En IX mellan två sådana nätverk gör att trafiken mellan dem inte behöver gå en längre omväg. Det blir snabbare för kunderna. Dessutom kan det vara billigare därför att två ISP:er byter vanligen trafik kostnadsfritt mellan varandra priser kan finnas för att skicka trafiken via "omvägen".

1.5. Geolocation och IP2Geo

Geolocation handlar om att avgöra var något fysiskt befinner sig på internet. Det är väldigt viktigt när det kommer till att optimera prestanda för content delivery networks (CDN). En metod är att använda DNS d.v.s. för den här bloggen slår man upp domänen seotaktik.com. Där ges IP-adress till närmaste DNS-server eller -servrar. För SEOTaktik.com:

DNS1.NAME-SERVICES.COM
DNS4.NAME-SERVICES.COM
DNS3.NAME-SERVICES.COM
DNS5.NAME-SERVICES.COM
DNS2.NAME-SERVICES.COM

Här utgår man med andra ord från att klienten befinner sig fysiskt nära sin DNS-server. Det stämmer inte alls alltid och det kan försämra prestanda helt i onödan.

IP2Geo / IP-2-Geo eller vad man nu väljer att kalla det försöker lösa problemet genom att mappa IP-adressen till den geografiska region som slutanvändaren befinner sig i. Hur exakta sådana tjänster är kan variera mellan dem och mellan geografiska regioner.

Övriga delar i artikelserien

Ännu har inga övriga delar publicerats.

2 kommentarer
Anonym sa...

I förväg: Vilka gynnas? Missgynnas någon?

2009-01-02 18:36
Anonym sa...

En svår fråga som är tidig. Men jag gjorde en initial tes ändå:

Google Strategi: Vilka gynnas / missgynnas?

2009-01-02 19:14

Kommentera