Yuhůův weblog o webu

ve středu 21. prosince 2005

Údajný růst Atlasu a Googlu

Zpochybňuji výsledky, které Navrcholu vydalo ve své pravidelné půlroční zprávě o podílu vyhledávačů.

Co např. tvrdí Navrcholu:

Celou tabulku můžete najít v tiskové zprávě nazvané Google hraje ve vyhledávačích stále větší roli. Procenta byla získána (dnes již klasickou) agregací vyhledávačů v refererech zaznamenaných měřícím systémem Navrcholu.

Co říkají mé zkušenosti

Pravidelně sleduji návštěvnost na mnoha webech (nejenom na svých) a mám k dispozici také podrobné údaje z Toplistu.

Jak si vysvětluji nesoulad své zkušenosti s tiskovkou Navrcholu:

Co je to "české prostředí"

V měřícím systému Navrcholu je registrováno dost anglických stránek. Na anglicky psaném webu má Google mnohem větší podíl než na webu českém, pro MSN to platí také. Přítomnost anglicky psaných stránek v Navrcholu tedy posouvá agregátní statistiky ve prospěch Google a MSN a v neprospěch českých portálů. Prostě špatný vzorek. Zbývá odhadnout velikost chyby:

Hlavní žebříček Navrcholu s převahou vede web funny-games.biz, který je (až na hlavní stránku) komletně v angličtině. Zeptal jsem se Jána Simkaniče, produktového manažera Navrcholu, do jaké míry byla statistika podle jeho názoru ovlivněna tímto webem:

Bez vlivu určitě úplně není, na druhou stranu ten vliv není nijak výrazný, už proto, že před šesti měsíci jsme ten web měřili také. Ty trendy by i bez toho webu vypadaly velmi podobně.

Když se ovšem podívám na statistiku funny-games.biz, nezdá se mi, že se tento web před šesti měsíci měřil také. Za listopad například ukazuje úctyhodných 4,8 miliónu návštěv, za jaro nic. Podle Jána Simkaniče je celkový počet návštěv zaznamenaný měsíčně systémem Navrcholu mezi 50 - 100 milióny. Takže podíl jenom tohoto anglicky psaného webu funny-games.biz dělá minimálně 5 procent návštěv, přičemž anglických webů bude ve vzorku víc. Má-li agregátní statistika vypovídat něco o "českém prostředí", měly by se anglické weby filtrovat.

Záhada růstu Atlasu

Když se podíváte do zdrojáku jakékoli stránky patřící pod Atlas.cz, uvidíte v kódu měřící kód Navrcholu. Výsledky hledání na Atlasu obsahují spoustu odkazů opět někam na Atlas (profily firem, další služby, listování výsledkem), což do systému Navrcholu přináší spoustu refererů Atlasu. Tým Navrcholu si tohoto problému je vědom, takže -- jak mi potvrdil Marek Antoš -- výsledky částečně filtruje. Část přístupů z Atlasu do celkových statistik ovšem zahrnuje, nefiltruje se všechno. Zdá se mi vysoce pravděpodobné, že vysoký podíl Atlasu -- 6,9 % -- je výsledkem nedostatečného filtrování klikání lidí uvnitř Atlasu.

Původně jsem o téhle tiskovce vůbec nechtěl psát, protože mi nepřijde nijak moc dobrá. Jenomže spousta "novinářů" data přebírá, aniž by je vůbec zpochybnili. I když ... najdou se i výjimky. Následuje spousta odkazů k tomuto tématu, které nemám čas komentovat. Proberte si je, máte-li zájem.

Tisková zpráva NAVRCHOLU.cz - Vyhledávač Google posílil na českém webu, Centrum ztratilo, Lupa - Reakce Centra ve stejném smyslu, jako tvrdím já, to jsem našel až teď - Co Atlas s Centrem, Marek Antoš - Google v Česku získává, conBlog - Úžasná novinářská zkratka na Technetu - Denní statistika z Toplistu - Povrchní agregace dat z Toplistu - Podíl světových vyhledávačů

Zajímavá je otázka, čím to, že tak pokleslo Centrum. Ono třeba nepokleslo, třeba za to mohou ty chyby. Vduchu odečítám pár tučných procent od podílu Googlu, MSN a Atlasu a přidávám je Seznamu a Centru.

trvalý odkaz

Přidat nebo číst komentáře, počet: číslo

Yuhůův weblog píše Dušan Janovský známý jako Yuhů. Kontakt. Weblog patří pod Jak psát web.