Yuhůův weblog o webu

Jste na stránce z archivu.

v neděli 30. listopadu 2003

trvalĂ˝ odkaz

Změna hostingu

Od středy tento web jede na novém serveru. Po zkušenostech z těch pár dnů musím konstatovat, že jsem velice spokojený. Je to podstatně rychlejší, doufám, že si všímáte.

Server provozuje xhost.cz. Zrovna ten stroj, na kterém běžím, má 1GB RAM, RAID1, běží na tom LFS. Poprvé mám možnost si trochu hrát s ostrým Apachem přes .htaccess a je to docela dobrá zábava. Důvodem pro výběr xhost.cz nebyly ani tak jejich stránky, jako spíš to, že se už delší dobu znám s adminy a považuji je za důvěryhodné. Asi jsem je moc nepotěšil, neb jsem si naklikal vlastní (relativně laciný) hostingový program.

Z předchozího hostingu jsem přešel ne že by byl špatný, ale linka do Slaného už nějak nestíhala. Domovské stránky zůstaly na původním serveru.

v sobotu 29. listopadu 2003

trvalĂ˝ odkaz

Dvě chyby v jednom dni

Napřed jsem vytvořil naprosto nelogický zápis v archivu. Nezávisle na tom jsem na dvě hodiny zakázal přístup na všechny důležité stránky tohoto webu. Na jeden den docela dobré skóre. Ty chyby jsou zajímavé a lze se z nich poučit.

Včerejší příspěvek Aktuality vpravo se zabýval tím, že na hlavní stránce weblogu budou vpravo aktuální odkazy. Do archivu jsem ale ty aktuální odkazy nevložil. Pixy mi napsal:

koukam jak puk a porad nechapu, jake ze "Aktuality vpravo", kdyz tam nic neni. Pak mi teprve doslo, ze to je stranka z archivu (pres permonika) a ze ty Aktuality jsou jen na homepagi (kam jsem - mam pocit - diky tomu zjisteni asi zabloudil poprve v zivote :)

Chvilku jsem na to taky koukal jako puk. Jak jako -- zabloudil poprvé v životě? Pixy nečetl nikdy můj blog? Co se děje?

Přečetl jsem si to pořádně. Pak mi došlo, že píše o stránce z archivu, kde ty odkazy opravdu nejsou. Jak se dostal do archivu??? Nikdo na ten spot přece neodkazuje! Nebo jo? Zmatek. Leda snad RSS. A je to - Pixy asi čte a kliká moje RSS, které míří do archivu. Tam sice píšu o pravém sloupečku, ale není tam.

Oblíbené rčení zní: uživatel přichází na web okénkem od záchoda. Vztahuje se to k vyhledávačům a znamená to zhruba tolik, že dobrý vyhledávač často nabídne nějakou podstránku namísto stránky hlavní. Nemá proto smyl předpokládat, že se běžný uživatel na podstránky dostává skrze klikání z hlavní stránky, ačkoli se s tím při návrhu skoro vždy počítá. Hlavně že to stále všem cpu! Podobný chybný předpoklad jsem udělal včera, třebaže se to netýkalo vyhledávačů. Je to dobré poučení.

Ta druhá dnešní chyba (už včerejší, psáno po půlnoci) způsobila dvouhodinovou nedostupnost všech hlavních stránek sekcí plus weblogu a hlavní stránky. Trochu moc rozpustile jsem si hrál se souborem .htaccess. Ale o tom až někdy příště.

v pátek 28. listopadu 2003

trvalĂ˝ odkaz

Aktuality vpravo

Už je to tak -- opičím se po Sově v síti. Denně nacházím pár odkazů hodných zaznamenání, ale nemám čas je komentovat řádným článkem. Proto se budou na tomto blogu objevovat pouze jako odkazy v pravém sloupci. Jsem zvědav, jak dlouho mi to vydrží.

S technickým řešením mi velmi pomohl Elka, když do šablonovacího jazyka programu EasyBlog operativně přidal možnost vkládání externích textových souborů. Textový soubor odkazů tvořím pomocí docela složitého bookmarkletu.

ve středu 26. listopadu 2003

trvalĂ˝ odkaz

Jiný výklad výskytu tagů

Že Jirka Bureš na Conblogu počítal html tagy v docela velikém vzorku používaných webů, jsem už psal. Zvítězily tabulkové tagy, z čehož jsme vespolek usoudili, že současnému webu vládne tabulkový layout. Nyní jsem si to probral pečlivěji a možná se mýlíme.

Vtip je v tom, že v tabulce, kde jednoznačně vítězí tabulkové tagy, jsou uvedeny "rodiny tagů", nikoli samotné tagy. Pro zápis tabulkového layoutu se spotřebuje průměrně asi třikrát víc html značek, než pro zápis layoutu beztabulkového (zjednodušeně řečeno jednomu tagu <div> odpovídá sekvence <table><tr><td>) Pokud budu dohromady sčítat jeden web tabulkový a jeden beztabulkový, tabulkový web převáží statistiku ve prospěch tabulkových tagů v poměru 3:1. Jirka Bureš naměřil poměr 16,1:3,9. Usuzuji z toho, že moderně designovaných webů je víc, než si myslíme. Nebo to může znamenat, že lidé rádi chodí na beztabulkové weby (analyzovány byly stránky skutečných uživatelů).

Marek Prokop z nelogicky vysokého podílu tagu <br> oproti tagu <p> usuzuje na použití wysiwyg editorů. To podle mě není dobré vysvětlení, protože wysiwyg editory naopak (co já vím) naperou tag <p> všude, kde je to napadne. Úspěch <br> tagů vykládám spíše nabubřelými levými a pravými menu (která mohou i za většinu odkazů), v nichž webmasteři pragmaticky používají <br>, neb je to nejjednodušší. Vím, co píšu, taky jsem to tak mnohde dělal.

Častý výskyt "rodiny" tagů formulářů vysvětluji podobně jako u tabulek. Formulářů sice není mnoho, ale mohou spotřebovat extrémní množství html značek. Vezměte si třeba průměrný tag <select> naplněný tagy <option>.

Střízlivým pohledem tedy vypadá situace docela optimisticky. Že je ještě na čem pracovat, dokládá hojně zastoupený tag <font> (5,5%).

Výskyt tagů 3. Conblog shrnuje problematiku a dává k dispozici zdrojová data.

v úterý 25. listopadu 2003

trvalĂ˝ odkaz

Tipy na programy

Aktuální přehled webových prohlížečů a HTML editorů jsem našel na stránkách Jindřicha Marka. Líbí se mi také jeho IT drobnosti, které se zabývají převážně GNU programy pro Windows. Jde o sbírku postřehů a softwarových řešení, již ocení zejména středně pokročilí webmasteři.

v neděli 23. listopadu 2003

trvalĂ˝ odkaz

Kdo vládne českému vyhledávání

Polovina hledajících návštěvníků přichází na české weby skrze portál Seznam. Vyplývá to z nové tabulky Podíl vyhledávačů v refererru na stránce globálních statistik Toplistu.

Celý článek s rozborem výsledků.

trvalĂ˝ odkaz

Blogy v politice

Pokud jako já patříte mezi pravidelné čtenáře výborného týdeníku Respekt, určitě vám neuniknul článek Adama Javůrka z minulého čísla Dejte mi síť a pohnu světem (článek žel není k dispozici on-line). Adam Javůrek se načnutému tématu dále věnuje v blogu Kyberšmok už více než týden.

V nadcházející předvolební kampani se američtí politici vypořádávají s internetem. Je to prý spíše evoluce než revoluce, ale význam webu pro práci západního politika je rostoucí.

Ve Velké Británii se objevují blogující poslanci, kteří neblogují pouze kvůli volbám, ale kvůli politické komunikaci obecně. Adam Javůrek udělal rozhovory s Tomem Watsonem, Richardem Allanem a s Clive Soleyem. Zdá se mi, že nejde pouze o módní vlnu a že význam blogů a webových stránek politiků bude rostoucí. Těším se na nějakého blogujícího českého politika, jejich současné osobní stránky, co jsem viděl, jsou nuda nuda šeď šeď.

Doplněno: Adam Javůrek narychlo "zhtmloval" článek Dejte mi síť a pohnu světem, navíc seskládal všechny související odkazy do nového zápisu.

v sobotu 22. listopadu 2003

trvalĂ˝ odkaz

Definice návštěvnosti jinak

Pod článkem o jakémsi internetovém Flash Mobu mě velmi zaujaly komentáře. Cituji (mírně přestylizováno):

Flashmob: ... Lidé chodí na weby, na kterých není nic, kvůli čemu by tam měli chodit. Naopak nechodí na weby skvělé a zajímavé. Tomu se říká návštěvnost. ...

ve čtvrtek 20. listopadu 2003

trvalĂ˝ odkaz

Vývojář Mozilly

Na Root.cz mi unikl už trochu starší, ale výborný rozhovor s Jánem Vargou, vývojářem Netscape a Mozilly. Je příjemné vědět, že se na vývoji současného nejnadějnějšího prohlížeče Firebird podílí krajané. Rozhovor se točí kolem Mozilly.

ve středu 19. listopadu 2003

trvalĂ˝ odkaz

Centrum.cz propadlo javascriptu

Centrum.cz má novou konstrukci hlavní stránky. Ve vlastní reklamě se chlubí, že je menší o 30 kB. Určitý pokrok vidět je, ale v zásadě jde pouze o nafouknutý marketingový trik. Napřed shrnu fakta, pak se zamyslím nad úmysly autorů kódu a nakonec vysvětlím, co se mi na tom nelíbí.

Fakta o Centrum.cz

Až donedávna měla hlavní stránka centrum.cz neúsporný html kód vystavěný na tabulkách. Je to ještě vidět v Google cache. HTML kód měl 38 kB. Jistě chápete, že to je dobrý potenciál pro zeštíhlení. S veškerou grafikou (i reklamní) měla stránka něco kolem sta kilobajtů.

Nevím přesně, kdy se spustila nová verze kódu, každopádně včera (18. 11.) večer už to běželo. Layout stránky je beztabulkový, nepozicovaný. Dobrá práce. Přepsání z tabulek do CSS ušetřilo asi tak dvacet kilobajtů. Další redukce hlavního zdrojáku (o 10 kB) autoři dosáhli tím, že velké části stránky přepsali do javascriptu a přenesli do externích souborů.

Co tím sledovali

  1. zmenšení hlavního zdrojáku za každou cenu (marketing)
  2. rychlejší opětovné načítání s využitím cache prohlížeče

Nynějším změnám věnovali autoři Centra již zmiňovanou stránku Centrum má nejštíhlejší homepage mezi českými portály. Mimo jiné se tam píše:

po prvním načtení je kostra stránky uložena do dočasné paměti prohlížeče. Při každé další návštěvě se stahují jen aktualizovaná data a stránka se tak zobrazuje ještě rychleji!

To je samozřejmě marketingový blábol (obsahující faktickou chybu), ale motivace je jasná -- uložit něco do cache. Zrovna kostra (hlavní zdroják) se načítá pokaždé znovu (kvůli reklamám a idotu), ale stále stejné části stránek přepsané do javascriptu by se do vyrovnávací paměti mohly ukládat. Načítání stránky by se tak mohlo zrychlit. Na hlavní stránce Centrum.cz jsou takhle vkládány javascriptem 4 části:

  1. hlavička
  2. odkazy na služby (levý sloupec nahoře)
  3. katalog (levý sloupec dole)
  4. patička

Dohromady to dělá asi 10 kB. Použité javascripty jsou v zásadě postavené stylem document.write(). Komu se právě vaří v žilách krev a říká si "to jsou barbaři, načítat obsah javascriptem", tak toho musím zchladit. Přenesení stabilních částí stránek do externích javascriptů je běžný a překvapivě spolehlivý způsob datové optimalizace. (Já třeba tak na stránkách Jak psát web načítám javascriptem všechna levá menu.) Opravdu by to mohlo hodně šetřit data, kdyby...

Proč je tedy Centrum stejně pomalé jako dříve?

Špatné cacheování: aby externí javascriptové kódy zrychlovaly načítání, musely by se ukládat do vyrovnávací paměti prohlížeče. Tyhle čtyři soubory se ale neukládají! Alespoň mně tedy ne. Jistě chápete, že namísto zrychlení to způsobí určité zpomalení zobrazování stránky -- prohlížeč totiž na celý javascriptový soubor čeká. A opravdu -- hlavní stránka centrum.cz se zasekává právě v místech, kde se mělo projevit největší zrychlení.

Pokud sečtu objem stahovaných dat nutných k vykreslení hlavní stránky centra (pomůže wget), dostávám se někam ke dvaceti kilobajtům (bez obrázků a reklam). V pomyslném závodě, ve kterém se autoři Centra cítí vítězi, obsadili dle mého názoru čestné třetí místo, možná druhé.

Ani kdyby bylo dobře nastavené cacheování, nebylo by vyhráno. Buďto by totiž museli nastavit nekonečnou expiraci (a pak by vkládané části prakticky nemohli nikdy změnit), nebo by se prohlížeč stejně čas od času ptal na hlavičku (a dokud by nedostal odpověď ze serveru, čekal by na načítání). To způsobuje zdržení, kvůli kterému se externí javascriptové texty doporučují dávat pouze na konec stránky (ne na začátek ani doprostřed). Ovšem není to dogma a názory se liší.

Je to zeštíhlení?

Přepsání hlavní stránky Centrum.cz do beztabulkového layoutu evidentně ušetřilo asi 20 kB. Dalších deset kilobajtů bylo násilně přeneseno do javascriptu, což hodnotím pouze jako marketingový tah (v konečném efektu to totiž velmi zesložiťuje vývoj). Celá stránka i s obrázky a reklamami přitom stále dosahuje nějakých osmdesát kilobajtů stahovaných dat. Osobně si zeštíhlení představuju jinak. Ale o tom až někdy příště.

Související:
Centrum.cz dokáže vykouzlit ďábelské barevné kombinace (Sova v síti)
Centrum shodilo 30 kilo (Maciweb)

v úterý 18. listopadu 2003

trvalĂ˝ odkaz

Centrum mění hlavní stránku

Centrumácká reklama http://img.centrum.cz/reklama/autopromo/hp/dieta/puc760.swf hlásí na středu 19. listopadu jakési zeštíhlení o 30 kilobajtů. Z adresy reklamy je zřejmé, že půjde o předělání hlavní stránky Centrum.cz. V tuto chvíli má hlavní stránka i se vší načítanou grafikou kolem sedmdesáti kil.

v pondělí 17. listopadu 2003

trvalĂ˝ odkaz

Stará škola HTML

Jirka Bureš proměřil početní výskyt html tagů v cache svého počítače. Ve výsledcích vítězí tagy jako a, td, br, img, tr a font. Je to celkem pochopitelné: dnešní weby mají nejčastěji tabulkový design (tagy td, tr) a obsahují spoustu menu (tag a). Menu jsou řádkována tagem br a kulaté rohy mají na svědomí spoustu obrázků. Bude zajímavé toto měření provést znovu po nějakém čase, zda se potvrdí nástup beztabulkových layoutů.

Větším vzorkem se Jiří Bureš probírá v pokračování: Výskyt tagů 2. Ale dopadlo to v zásadě stejně.

trvalĂ˝ odkaz

Brání se Google spamu?

Čím více vede na vaše stránky zpětných odkazů s textem "auto", tím budou mít stránky lepší pozici ve vyhledávání slova "auto". Tak zní univerzální pravidlo pro optimalizaci stránek. Pro Google to ale od nynějška nemusí být pravda. Zrovna probíhá změna indexu nebo algoritmů Google, akce se jmenuje "update Florida". Dotýká se to zejm. anglicky psaných stránek, v českých výsledcích jsem ještě nezaznamenal větší změny.

Všechno podstatné, co se zatím ví, shrnuje About weblog:

Google nyní pravděpodobně snížil (možná úplně) váhu textu ve zpětných odkazech a znovu ho reindexuje.
Google se snaží hodnotit odkazy podle tématického zaměření stránky. Děje se tak z důvodu boje proti spammingu. (Petr Weida, 17. 11.)

V této souvislosti jsem si vzpomněl na překlad Ivany Čapkové Spameři přecpávají webové deníčky (Root.cz, převzato z Wired News). Některé velmi rozšířené blogovací a redakční systémy umožňují automatické vkládání příspěvků -- spamu určeného pro vyhledávače. Pak stačí správně naprogramovat robota a nasázet si po diskusích hodně zpětných odkazů s konkrétním textem. Poslední dobou se to stává stále víc. To může vyhledávače, kteří si textu zpětných odkazů všímají (např. Google), pěkně zblbnout. Možná právě proto se na Google dějí změny.

trvalĂ˝ odkaz

Pročpak s tím neumím?

Pro webového profesionála je těžké vcítit se do uživatelů, pro které není internet denním chlebem. Každý to řeší jinak, například já se schválně odmítám učit některé příliš moderní věci. Jinak řečeno snažím se weby ovládat jako úplný kretén, jenže mi to moc nejde.

Celá esej o příliš moderních věcech.

v úterý 11. listopadu 2003

trvalĂ˝ odkaz

Google by mohl být koupen Microsoftem

Naznačuje Michal Illich na Lupě.cz v článku Microsoft, Google, Amazon: Co se děje. Cituji:

Microsoft ty peníze má. Sedí mu na kontě několik desítek miliard dolarů, které mu tam kvůli jeho dominantnímu postavení sype 98 procent uživatelů. ...

a o kus níže:

Google koupen být chce. Jeho majitelé jsou dva zakladatelé Page a Brin, rizikoví investoři, Yahoo, a pak manažeři a zaměstnanci. Zvlášť zmínění investoři se určitě těší na superúspěšný exit, a tak celá firma již delší dobu zkoumá cestičky, jak svoje postavení dobře zpeněžit. ...

v neděli 9. listopadu 2003

trvalĂ˝ odkaz

CSS po ruski

Když si dáte v Google vyhledávat text "CSS" ve stránkách psaných česky, objeví se na prvním místě rusky psaná stránka CSS OAO RŽD s url http://www.css-mps.ru/ . Google evidentně chybuje při rozpoznávání jazyka a ta ruská stránka má css v titulku i v doméně plus natolik slušný PageRank, že se dostala ve výsledcích na první místo.

Na rozdíl od většiny ruských stránek je ruský text v html zdroji celý zapsán pomocí číselných entit. Pokud se na tu stránku http://www.css-mps.ru/ podíváte lynxem, uvidíte text, který při troše představivosti skutečně lze za češtinu považovat. No, spíš při hodně bujné fantazii, každopádně googleovský algoritmus rozpoznání jazyka to nějak zmátlo. Když jsem o tom pak dumal, uvědomil jsem si, jak málo vím o tom, podle čeho vyhledávače poznají jazyk dokumentu. Nevíte někdo?

Doplněno: ta divná ruská stránka je první jenom při použití hledání v kódování UTF-8. Při hledání v iso-8859-2 se nenajde.

v sobotu 8. listopadu 2003

trvalĂ˝ odkaz

Tři verze Exploreru najednou

Splnil se mi sen: můžu bez restartování Windowsů prohlížet stránky v Internet Exploreru tří různých verzí. To dříve nešlo, tedy přesněji Microsoft tvrdil, že to nejde. Dnes je možné vedle Intenret Exploreru 6 rozběhnout i verze 5.5 a 5.0.

Celý postup instalace a komentář.

v pátek 7. listopadu 2003

trvalĂ˝ odkaz

Vyšší dívčí javascriptu

Myslel jsem si, že umím Javascript docela dobře. Přesto jsem ve článku Objektově orientované programování v Javascriptu (interval.cz) od Michala Kusýna objevil pár velmi užitečných věcí, které jsem neznal. Například jsem netušil, že u objektů javascriptu funguje dědičnost (asi jsem to nikdy nezkusil).

ve čtvrtek 6. listopadu 2003

trvalĂ˝ odkaz

Nový seriál od Marka Prokopa

...Nejprve ale vysvětlím, proč nehovořím o zvyšování, nýbrž o kultivaci návštěvnosti. U návštěvnosti stránek totiž nejde jen o její objem (kolik lidí přijde), ale i o její kvalitu, která zahrnuje zejména příslušnost návštěvníka do cílové skupiny (kdo přijde) a jeho okamžité potřeby (proč přijde) ...

... píše Marek Prokop v článku Jak zvyšovat návštěvnost webových stránek na Živě.cz. Pokud se oborem zabýváte dlouho, není tam nic moc nového, ale pokud jste v oboru nováčci, je článek výborný studijní materiál. (Pro zajímavost: článek jsem zcela neobvykle nenašel v blozích, ale náhodnou návštěvou serveru zive.cz.)

trvalĂ˝ odkaz

Morfeo a váha slov

Všimnul jsem si, že vyhledávač Morfeo používá jiné váhy hledání při zadání jednoslovného dotazu a jiné váhy u víceslovného dotazu. Zatímco u jednoslovného dotazu velmi preferuje výskyt klíčového slova v url, např.

http://morfeo.centrum.cz/?q=kredit
http://morfeo.centrum.cz/?q=karta

u víceslovných dotazů má pravděpodobně výskyt klíčového slova v url význam malý. Srovnejte předchozí dotazy a dotaz "kredit karta":

http://morfeo.centrum.cz/?q=kredit+karta

Závěr: pokud optimalizujete na klíčové slovo, výskyt slova v url přinese návštěvníky z Morfea. Kdo optimalizuje na frázi, ten musí u Morfea použít jiné metody, zejm. výskyt fráze v prostém textu (v libovolném mluvnickém tvaru).

trvalĂ˝ odkaz

Mně taky

České internetové servery mi přijdou ospalé, bez duše..., míní Patrik Zandl (Marigold.cz).

trvalĂ˝ odkaz

Budou blogy vydělávat?

Hezký článek Michala Jiránka Veblogy mají zlaté dno jen pro někoho (Lupa.cz) se pokouší přijít na to, kdo má vůbec nějaký příjem ze psaní weblogů. Závěr zní, že příjmy jsou prakticky bezvýznamné na všech stranách (jak na straně autorů, tak na straně blogovacích systémů). A tak opět přichází poznání, že jediný zisk, který z toho může být, je vyšší odborná prestiž autora nebo ve speciálních případech marketing nějakého produktu.

ve středu 5. listopadu 2003

trvalĂ˝ odkaz

UML na Intervalu

Návrh aplikací v UML se jmenuje první díl seriálu o jazyce UML, který bude vycházet na Intervalu.cz. Píše to René Stein. Kvalitních zdrojů o UML v češtině (pokud vím) moc neexistuje, takže seriál by se mohl hodit.

Co je UML: zjednodušeně řečeno je to dohoda o tom, jak se kreslí obrázky a diagramy programů. Když začínáte kreslit schéma nějakého programu, kteslíte si nějaké svoje obrázky. UML je norma pro tyhle obrázky, aby jim přesně rozuměl každý, kdo to umí.

Jinak řečeno UML je jazyk, kterým se nakreslí obrázek, jenž pochopí jak úřednice nebo obchodník, tak programátor.

Všechny knížky nebo návody o UML, které jsem kdy četl, byly příííšerně teoretické. Nejjednodušší příklady byly tak složité, že jsem je nepochopil. Těším se tedy, že odkazovaný seriál bude možná obsahovat dobré příklady. Uvidíme.

Já jsem věděl, že tomu nerozumím: reakce UML není pro sekretářky, Chinin

v pondělí 3. listopadu 2003

trvalĂ˝ odkaz

Stále sháním lidi

Když jsem koncem září sháněl kodéry, tak jsem jich pořád nesehnal dost. Pokud si myslíte, že umíte HTML a můžete dělat v Praze na plný úvazek, napište mi. Podrobnosti a podmínky stejné jako v minulém příspěvku.

v sobotu 1. listopadu 2003

trvalĂ˝ odkaz

Umístění prvků blogů

Jirka Bureš proklikal 52 blogů a přehledně rozkreslil nejčastější rozmístění prvků blogů jako jsou trvalý odkaz, nadpis, datum a další.

Yuhůův weblog píše Dušan Janovský, nick Yuhů. Pište mi na janovsky@gmail.com