Outer Web Thought Log
March 10, 2005
Links, Google en De Blogosfeer

Ik volg nu al een poosje de Belgische blogosfeer (what's in a name), maar verder mag ik mezelf gelukkig prijzen om ook op wat uitlandse weblogs geabonneerd te zijn, en dat eigenlijk al een hele poos langer. Daarnaast heb ik, als niet-Google Toolbar gebruiker, de pagerankstatus extension voor Firefox eens geïnstalleerd, en met enig heimelijk gegrinnik gemerkt dat België's blogosfeer echt wel een scheet is op het wereldwijde net.

Google's PageRank, let's face it, is eigenlijk zowat de enige pasmunt om hits te vangen in de niet-"ons kent ons"-context, en dat de Belgische blogosfeer bij uitstek zo'n context is, merk je al behoorlijk snel. Alle gegoochel met andere search engine-weightings ten spijt, leert wat rondsurfen me dat Google een kleine 50% van de searches doet op het Internet, gevolgd door Yahoo (30%) en MSN (20%). De rest is veeleer statistische ruis. Op meer technisch-georiënteerde websites kom je zelfs snel op 80% en meer inkomende links via de Google search engine. Google rules, met andere woorden, tot spijt van wie het benijdt, en ze letten bijgevolg erg goed op hun tellen om hun company-credo "Don't Be Evil" na te volgen. Laat ik veronderstellen dat de algoritmes die een PageRank toekennen dus niet onbedacht opgesteld zijn, en dat Google zijn best doet om alle pogingen om hun ranking model te ondermijnen tegen te gaan.

Als we nu Peter's lijst even nemen ter hand nemen (laat vooraf duidelijk zijn dat ik zijn initatief ten zeerste apprecieer), en daarnaast even gewoon de PageRank zetten, zien we het volgende (bij sommige sites ben ik van de inkompagina eerst naar de eigenlijke blog gesurft, die meestal een hogere PR had):

Twee zessen dus, flink wat vijven en vieren, en de rest: jammer maar helaas. Plaatsen we daar nu eens de nieuwe (Vlaamse) topblogs volgens de DSO blog (zelf een povere 4) bij, dan komen we op dit uit:

Hm. Een beetje under-researched van de DSO redactie, niet? Maar wat leren we nu hieruit? Wel, daarvoor moeten we deze PageRanks even in perspectief plaatsen. Een aantal bekende internationale bloggers en één groepsblog dus:

Stuk voor stuk zevens, een jammere vijf en zes, en Dave, de peetvader van het bloggen een vette 8 natuurlijk. Ikzelf, Veerle en Mathias hebben het wellicht aan ons internationale publiek te danken dat we als Flandriens toch een behoorlijke 6 toebedeeld krijgen: meer inbound links, en vermoedelijk ook vanop websites met een hoge PR. Veerle en Mathias doen het dan ook in het Engels, en ikzelf heb een periode achter de rug dat ik door hoog-scorende internationale bloggers af en toe wat aandacht en bijhorend Google-juice kreeg. Daarbij komt nog dat ik zowat driekwart van mijn email naar publiek-gearchiveerde lijsten stuur, en mijn blog onderaan steeds vermeld wordt.

Het algoritme achter de Google ranking gaat niet uit van een lineaire verdeling, maar een logaritmische. Dat verklaart waarom 7 een rank is waar we eventueel nog van kunnen dromen, maar de achten, negens en tienen ranks zijn die voorbehouden zijn voor de groten der aarde: BBC, ESPN, Nasa, Apple, Yahoo, Microsoft, Google zelf, The Internet Archive, Wikipedia: sites met tienduizenden interne links, waar honderduizenden andere sites naartoe linken. Het ogenschijnlijk kleine verschil tussen een 5 en 6 is dus helemaal niet zo onschuldig als men op het eerste zicht zou denken.

Het niet-gepubliceerde, maar veelvuldig ge-reverse-engineerde algoritme is gebaseerd op de volgende basisconcepten:

En zo komen we (eindelijk) bij de kern van mijn betoog uit, en dat beperkt zich tot twee simpele puntjes:

Pro-globalisatie? Misschien. Het neveneffect van bloggen in een minder populaire taal? Wel, Nederlands komt slechts op plaats 48, dus een tweetalige of Engelse blog is wellicht géén gek idee voor link whores. Het hoeft natuurlijk niet, dat spreekt voor zich. Maar het spiritueel-klinkende "geef wat je wil krijgen" gaat ook hier weer zeker op: wie gul is met links krijgt wellicht ooit wat Google Juice terug. En hou er ook rekening mee dat Google wél de mogelijkheid biedt om het zoekresultaat te beperken tot sites in één bepaalde taal, maar dat driekwart van de websites die taal niet fatsoenlijk kenbaar maken aan de Googlebot.

De gniffel in mij kan niet nalaten om vast te stellen dat het voorrecht om te geven bij deze niet in handen van de happy in-crowd is.

Enfin. Wat eerst een manifest van ergernis was, in de stijl van Bruno's gerechtvaardigde opmerkingen, werd uiteindelijk een uurtje vrolijk opzoekplezier. En dat is toch het Wonder van het Wilde Web, niet?

Posted by stevenn at March 10, 2005 04:40 PM (nl)
Trackback Pings

TrackBack URL for this entry:
http://blogs.cocoondev.org/MT/mt-tb.cgi/2192

Listed below are links to weblogs that reference Links, Google en De Blogosfeer:

» Domeinnaam from Domeinnaam
De ontvanger van een domeinbon kan kiezen uit een .nl .com .net .org .cc .tv .nu .to .ws .eu Of alle goeie na... [Read More]

Tracked on March 12, 2006 01:50 PM

» Domeinnaam from Domeinnaam
De ontvanger van een domeinbon kan kiezen uit een .nl .com .net .org .cc .tv .nu .to .ws .eu Of alle goeie namen zijn al vergeven (Net als Bak... [Read More]

Tracked on March 14, 2006 06:46 PM

Comments

Een zeer mooi artikel, Steven!

Posted by: bruno at March 10, 2005 05:47 PM

De clou lijkt gewoon:

- er vroeg mee begonnnen zijn,
- veel posten,
- en volhouden.

Mensen als Coates en Kottke zijn wel leuk om lezen, maar daarom niet interessanter dan vele andere techno/communicatie bloggers.

Hun verdienste is gewoon dat ze eerder dan de meeste anderen begonnen zijn met dit gigantische piramidespel: als er maar 7 blogs op de wereld zijn, en jij komt er bij als achtste, mag je verzekerd zijn van een fair share in de blogrolls van die 7. De volgende 8 bloggers in de wereld kijken naar de blogrolls van hun voorgangers, en lap, weer een aanzienlijk aantal nemen je op in hun leeslijst, en zo rolt de sneeuwbal verder.

Als je pas in de 8ste generatie van het populariteitsspel naar buiten komt, begin dan maar eens aandacht te zoeken bij je 1.677.216 - 1 voorgangers hoor...

Die A-list bloggers zijn verder even incrowd als onze de eigen Belgische blogosfeer, lijkt me, of vind je dat de vroeger vogels effectief zoveel interessanter schrijfsels produceren?

Posted by: pascal van hecke at March 10, 2005 06:59 PM

@Pascal: enerzijds, laat ik heel eerlijk zijn (niet dat een andere optie bestaat, maar alla) is dit natuurlijk gewoon een stok in het hoenderhok gooien. Anderzijds: meteo.be: PR6, vrt.be ditto, ugent.be: PR8 - en dit waren de eerste drie die in me opkwamen. Google werkt met de wet van de grote aantallen, en micro-statistiekjes en mini-biotoopjes om een lekker & gezellig groepsgevoel te creëren gaan bij dat soort aantallen niet meer op. Google meet ook méér dan de blogosfeer, en brengt ook links van buiten die sfeer in kaart. Ik heb als referentiepunt inderdaad lukraak wat internationale A-list bloggers gekozen, waarvan er een aantal echt wel vernieuwend bezig zijn of waren, en/of waarvan er een aantal toch blijk geven van jarenlang "aan de weg timmeren". Je hebt mijn "hard-core techies" blog list nog niet gezien. ;-)
Mijn gedacht is dat het grappig is om te merken dat regionalisering ("Vlaamse blogs") eigenlijk gewoon een herhaling van de buitenlandse fenomenen inhoudt, met dezelfde kemphaantjes, media-aandacht en A-listen, alleen geschaald naar een niveau dat het een beetje lachwekkend wordt (sorry).

Posted by: Steven Noels at March 10, 2005 09:17 PM

Zzz... (Ohw, sorry, in slaap gevallen. Heb ik iets gemist ?)

Posted by: Huug at March 11, 2005 02:09 AM

Interessant, maar iets ontgaat mij: wat is het belang van het in rekening brengen van interne links? Zet dit niet een deur open voor manipulatie?

Voor de rest denk ik dat DSO niet de bedoeling had een lijst te maken van de populairste blogs, wel een persoonlijke keuze van volgens hen goeie blogs. (het staat er trouwens in zoveel woorden boven) Bieslog bijv. vind ik ook schitterend, het zal mij worst wezen wat de pagerank is...

Posted by: Peter at March 11, 2005 09:30 AM

@Peter: http://www.webworkshop.net/pagerank.html#internal_linking

Internal linking kan dus gebruikt worden om de PR van de homepagina te maximaliseren, maar niet om in een hogere PR terecht te komen "on your own right": daar heb je inbound links voor nodig. Belangrijk om weten is dat Google een PR toekent per pagina, en niet per site. Vandaar dus dat ik Peter Forret's beslissing afval om alleen blogs met een eigen domeinnaam in zijn lijstje op te nemen: Google is perfect in staat om een de verschillende blogs "te zien" die onder het blogs.cocoondev.org domain zitten.

En verder is de recente DSO voorkeurslijst idd geen hitparade. Ik heb de vermelde Vlaamse blogs mee in mijn PR analyse opgenomen als referentiekader: wat goed is volgens de DSO-redactie is niet noodzakelijk "goed" (FWIW) volgens Google. Een ander mooi voorbeeld is http://home2.scarlet.be/pdier/opener.htm - een "blog" die al jaren bezig is, ongetwijfeld voor een klein maar trouw publiek, met een lage PR maar toch een mooie site om te volgen. Dat Bieslog nergens een PR krijgt is idd een ferme gemiste kans: alleen hebben ze dat aan zichzelf te wijten, want er staat een <meta name="robots" content="noindex,follow"> header in al hun paginas.

@Huug: nou, dat ligt wellicht aan de nachtdiensten in het geldfabriekje. ;) Misschien zijn mijn stellingen not done of doe ik mijn best niet genoeg om mee te huilen met de welpjes, maar ik vond de research achter deze post persoonlijk interessant en verrijkend. Shelley's post vond ik werkelijk magistraal. En verder wil ik de goegemeente verblijden met het nieuws dat Het Nieuws eigenlijk oude wijn in kleine nieuwe zakjes is. Wat voor zich spreekt, natuurlijk: nihil nove sub sole.

Posted by: Steven Noels at March 11, 2005 10:06 AM

Er is zoiets ontstaan als Googlologie. Er worden peperdure seminaries ingericht tegenwoordig over hoe je site hoger in de ranking krijgen. Geen 'b' gebruiken, maar 'strong', je meta's niet meer dan 15 en niet minder dan 10 keywords, en vooral geen javascript gebruiken want daar kunnen de bots niet aan uit. En nog veel meer maar dat word je verteld op die seminaries, of een vetbetaalde Google-consultant fine-tunet je site op maat van Google. De Google-algoritmes moeten zowat het best bewaard zakengeheim ter wereld zijn.

Ach, ik heb liever één hit van een lezer, dan 1,000 hits van ramptoeristen. Tenzij je natuurlijk ads voert. En de Amerikaanse blogs zijn ook kringrukkers hoor: Bush, Apple, Irak, IFPI, lawsuits, en dan heb je het wel gehad. Voor een lol- en amateurgebeuren als webloggen hoeft die ranking voor mij allemaal niet.

Uiteindelijk zijn die rankings uiteraard gebaseerd op pure hits. Wat mij meer zou interesseren is de tijd gespendeerd op een site, en vooral, herhaald terugkeren. Maar ik zet zelf ook mijn third party cookies af dus ik vrees dat dit wel onmeetbaar is.

Posted by: VH at March 13, 2005 02:45 AM