ACCES A ERROR LOG

Pokúsim sa vám ukázať ako treba čítať log hlásenia a čo sa v nich dá rozumné zistiť pre zlepšenie fungovania vášho webu.

Najprv čo vidíte a to postupne z ľava do prava: Prvá je IP adresa (66.249.79.87) vstupujúceho, nasleduje čas ([03/Feb/2015:00:02:38 +0000]) vstupu, Url adresa ("GET /sk/privacy-policy.html HTTP/1.0" 200 3524 "-") ktorá bola prehliadaná, a posledná je informácia o tom kto alebo komu patrí robot ("Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)") ktorý vás prezeral. Opýtate sa a načo mi to je? Opäť jednoduchá odpoveď: Všetko čo je v týchto logoch zapísané by malo interpretovať že vaše nastavenia sú spravne konfiogurované. Majú mať všetky vstupy výsledok 200. To je tento zápis: "GET /sk/privacy-policy.html HTTP/1.0" 200 3524 "-".

Naschvál som vybral dnešný zápis kvôli tej 404 chybe aby som demonštroval akú má silu tento súbor. Riadok 5, "GET /sk/obchodne-podmienky.html HTTP/1.0" 404 2708 "-" samozrejme že mám tento súbor už opravený na privacy-policy.html a teda ak niečo prepíšete a teda vytvoríte novú adresu je treba to aj v htaccesse zapísať a dať tak presmerovať neexistujúcu url na redirect 301.

Riadok 7: 186.28.81.66 - - [03/Feb/2015:00:19:18 +0000] "GET / HTTP/1.0" 301 457 "-"
Riadok 8: 186.28.81.66 - - [03/Feb/2015:00:19:18 +0000] "GET / HTTP/1.0" 200 3327 "-"

Rovnaká IP adresa a rovnaká url adresa a dva rozdielne výsledky: Nemusí vás to znepokojovať pretože prvý vstup je na adresu http://domena (GET / HTTP/1.0" 301 457 ") a 301 je presmerovanie, 457 znamená obsah v bajtoch.
Druhý vstup na riadku 8 je 200 a to znamená že (presmerovanie 301 hore v riadku) že prezeraná url je kanonická url webu a je správna. To je toto: "GET / HTTP/1.0" 200 3327 " a opäť čislo 3327 znamená obsah v bajtoch na danej prezeranej url.

Každý boot (riadok 41) overuje vstup pre robots.txt "GET /robots.txt HTTP/1.0" 200 1622 " a opakuje hľadanie aj pre "GET /robots.txt HTTP/1.0" 301 494 " čo opäť ukazuje či sú vaše adresy správne konfigurované. Teda či je platný na požiadavke pre http alebo na požiadavke http://www adrese.

Aby ste videli (riadok 107) že viem o čom píšem: "GET /es/sitemap.xml.gz HTTP/1.0" 200 915 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)" tak sitemap v komprimovanej forme si sťahujú roboti prehľadávačov aj prehliadačov.

Ak máte správne zapísaný favicon.ico tak tu nájdete informáciu (riadok 132) "GET /cz/img/favicon.ico HTTP/1.0" 200 788 "-" "Mozilla/5.0 (Windows NT 6.1; rv:6.0) Gecko/20110814 Firefox/6.0 Google favicon" takže ak ste niekde získali informáciu že favicon.ico patrí do root tak to nie je úplne pravda. Webmastri ho začali pred rokmi strkať priamo do root a tak ho W3C začali akceptovať aj z tohoto umiestnenia. Favicon.ico je obrázok ako všetky iné obrázky a preto patrí do priečinka s obrázkami a nie do root. V riadku 142 naopak nájdete informáciu "GET /favicon.ico HTTP/1.0" 404 3405 " o tom že robot sa pokúšal nájsť favicon.ico aj v root serveru. To však problém nie je pokiaľ favicon.ico máte vychádzajúci z priečinka pre obrázky.

Riadok 163 a v ňom sa dozviete ako prišiel na vaše stránky návštevník. Teda akým spôsobom vás vyhľadal na internete. Môžete link skopírovať a vložiť do príkazného riadku a nájdete aké použil kľúčové slová a teda na akej pozícii dohľadal váš web. search.seznam.cz/?q=jin%C3%BD+v%C3%BDraz+pro+rulety&sId=ak3IlN5ywg2CdGLh_zDr&sourceid=top&sgId=6nwN9vI2RZf_hnANYXkR0NwokSmNTnpokSmMYGZvz7%3D%3D&oq=jin%C3%BD+v%C3%BDraz+pro+rulety&aq=-1&su=b. K tomu patrí informácia o celkovom seo na vašom webe, pretože tu sa dozviete na akej pozícii ste dohľadateľný vo vyhľadávači.

Error log je samostatný súbor ktorý je dopĺňaný všetkými hláseniami 404 z log súboru. Mimo týchto 404 sú tam zápisy typu: [Tue Feb 03 09:23:43 2015] [error] [client 89.187.152.207] File does not exist: /favicon.ico" čo je v podstate to isté ako v riadku 142. Ide o to že do error.log s zapisujú výhradne zápisy 404. Sú samozrejme zapisované aj takéto zápisy o výpadkoch: Warning: mysql_connect(): Lost connection to MySQL server at 'reading initial communication packet', system error 0. Takže sa dozviete kedy vaše stránky nefungovali. Na mojom webe takýto zápis neznamená nič, pretože moje stránky pri takomto výpadku nepadli. Ako je to možné??? Hmmm, ja totiž fungujem na iných princípoch a SQL mám úplne na iné účely ako na to aby spolupracovali z url adresárom.

Samozrejme ak urobíte v htaccess súbore chybu tak ta to prejaví v zápise error log napríklad takto: .htaccess: AddType requires at least two arguments, a mime type followed by one or more file extensions... Takže ak robíte je dobre pozrieť či nie je problém na strane zápisu a zvalidovať ho takýmto pozretím do error logu.

Kto nerobí nič nerobí ani chyby.

Ak potrebujete rozobrať problém alebo čokoľvek okolo webu tak píšte komentáre s url adresou webu.

source code - zdrojový kód

utorok 3. februára 2015

ACCES A ERROR LOG

Žiadne komentáre:

Zverejnenie komentára