Veebilehe SEO audit. Miks kodulehe sisu pole indekseeritud?

Avaleht/Kodulehe optimeerimine/Veebilehe SEO audit. Miks kodulehe sisu pole indekseeritud?

Veebilehe SEO audit. Miks kodulehe sisu pole indekseeritud?

SEO seostub tihtipeale paljudele märksõnade, tiitli ja metakirjelduse kirjutamisega. Kuid see pole nii. Sinu kodulehe positsiooni otsingutulemustes mõjutab ka kodulehe tehniline olukord.

Selles kodulehe auditi postituses vaatame, mis võivad olla need tehnilised põhjused, miks kodulehe sisu pole otsimootorite poolt indekseeritud.

kodulehe analüüs

Veebilehe tehniline SEO audit ja ettepanekud, kuidas probleeme lahendada

Veebilehe muudatused peaksid põhinema kasutajate testidel ning kontrollitavatel faktidel, mitte põhinema ainult arvamustel. Just selle pärast on kodulehe SEO audit vajalik, sest nii saame kaardistada veebilehe probleemid ning nende alusel viia läbi kodulehel muudatusi.

Veebilehe auditi tulemusel tehtud paranduste abil võid parandada otsingutulemuste positsioone, parendada kasutajakogemust ning muidugi parandada tehnilised vead.

Veebileht on nagu inimene

Kui sul on tervisega probleeme, siis hea arst võtab sinult vereproovid ja teeb teised vajalikud uuringud, enne kui ütleb välja diagnoosi ja määrab ravi. Täpselt sama protseduur kehtib ka sinu kodulehe puhul.

Esimene asi millest me uurimist alustame on see, et kas Google leiab sinu lehe ikka üles.

Miks otsirobotid ei leia sinu kodulehe sisu üles?

Kui otsirobotid ei pääse kodulehte indekseerima, siis see tähendab, et sinu veebileht pole ühegi märksõnaga leitav otsitulemustes. See tegelikult tähendab seda, et sinu kodulehele jõuavad ainult need külastajad, kes teavad veebilehe aadressi.

Mida tuleks siis teha, et mu koduleht oleks Dr Googlele ikka nähtava ja leitav?

1. Kas Google Search Console’is on olemas XML sitemap (sisukaart)?

Sitemap on justkui kodulehe sisukaart, mis sisaldab kõiki sinu kodulehe linke. Sitemap võib sisaldada ka olulist infot sinu sisulehtede kohta, näiteks millal viimati uuendasid mõnda sisulehte.

Otsirobotid kasutavad sitemap’i, et paremini aru saada kodulehest ning selle alusel indekseerida kodulehe sisu.

Sitemap’i olemasolu pole kohustuslik ega mõjuta Google’i otsingutulemuste positsioone.

Kuid kindlasti aitab sisukaart kaasa kodulehe indekseerimisele, eriti kui tegemist on suuremahulise kodulehega või kui kõik sisulehed pole omavahel lingitud ning puuduvad välised viited sinu veebilehele.

Kuidas kontrollida? Logi sisse Google Search Console’i > vali Crawl > Sitemaps.

Kui näed, et puudub sitemap, siis lisa oma kodulehe sitemap. Postitusest Submit Your Sitemap To Search Engines leiad juhised, kuidas lisada Yoast SEO plugina sitemap’i erinevatesse otsimootoritesse.

2. Kas Google Search Console’i lisatud sitemap sisaldab veateateid?

Kui sitemap’i raport sisaldab veateateid, siis on soovitav need parandada. Sitemap’i veateadete listi ja parandusettepanekud leiad Search Console Help artiklist Manage sitemaps with the Sitemaps report.

Kuidas kontrollida? Logi sisse Google Search Console’i > vali Crawl > Sitemaps > kliki sitemap’il > vali vaheleht Sitemap errors.

Pildil on näha täpne asukoht Search Console’is sitemapi veateadete kontrollimiseks.

3. Kas olulised sisulehed sisaldavad palju linke?

Mitmeid aastaid tagasi oli Google’i poolt soovitus, et sisulehel poleks üle 100 lingi. Nüüdseks on see piirang eemaldatud, kuid see ei tähenda, et sinu kodulehe sisulehed peaksid sisaldama sadu ja sadu linke.

Kui sisulehel on üle 100 lingi, siis tasuks mõelda, kas kõik lingid on väärtust lisavad ning vajalikud. Lisaks tasuks arvestada, kas linkide arv mõjutab kasutajakogemust ning kas sisuleht tundub spämmina.

Siiski kui sisuleht on väga mahukas, näiteks Wikipedia artikkel, siis tõesti võib juhtuda, et ka linkide koguarv on suur ning põhjendatud.

Kuidas kontrollida? Kõige mugavam on seda teha SEO tarkvaraga, näiteks SEO PowerSuite või Screaming Frog Crawl, kuid olulisemaid sisulehti saad kontrollida ka veebipõhise SEO Review Tools Internal Link Analyzer tööriista abil.

4. Kas olulised sisulehed on vähem kui nelja kliki kaugusel avalehest?

Google on öelnud, et mida lühem on teekond olulise sisuleheni, siis seda kaalukam on ka vastav sisu ehk need sisulehed saavad paremaid tulemusi otsitulemustes.

Vaata videot, kus John Mueller Google’ist selgitab, et teekonna pikkus on olulisem kui URL-aadressi struktuur.

Kuidas kontrollida? Kirjuta omale välja, millised on sinu kõige olulisemad sisulehed, nendeks võivad olla näiteks kindlad teenused või tooted. Seejärel mine oma kodulehe avalehele ja vaata mitme klikiga jõuad oma oluliste sisulehtedeni.

5. Kas robots.txt fail blokeerib otsirobotitele juurdepääsu?

Robots.txt fail annab otsirobotitele teada, milliseid lehti külastada ja indekseerida ja milliseid mitte. Tavapärase WordPressi kodulehe puhul pole vaja muuta robots.txt faili.

Loe täpsemalt, milleks on robots.txt fail ja mida Sa sellega tegema pead?

Kuidas kontrollida? Logi sisse Google Search Console’i > vali Crawl > robots.txt Tester. Kas failis näed järgmisi ridu?

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Kui nii, siis on WordPressi robots.txt failiga kõik korras.

6. Kas koduleht on külastajatele nähtav ning kas indekseerimine on lubatud?

Kui kodulehe külastajavaade on salasõnaga kaitstud või vastvalminud veebilehel on ununenud indekseerimise lubamine, siis ei leia ka otsirobotid sinu lehte üles.

Kuidas kontrollida? Vaata, kas sa külastajana näed oma kodulehte. Seejärel logi oma kodulehele sisse ning vali vasakpoolsest menüüst Sätted > Lugemine > kontrolli, kas oled eemaldanud märkeruudu „Keela selle saidi indekseerimine otsimootorite poolt“ valiku eest.

Kas otsirobotid indekseerivad sisulehti, mida ei peaks?

Kui otsirobotid leiavad üles ja indekseerivad sisulehti, mis ei peaks olema leitavad, siis sa raiskad otsirobotite ressursse. See võib mõjutada kui paljusid unikaalseid linke suudab otsirobot leida või kui tihti käib ta sinu veebilehte külastamas.

Samuti tähendab see, et lehed, mis ei peaks olema avalikud, on leitavad otsitulemustes.

1. Kas 404 leht saadab vale HTTP olekukoodi ehk serverikoodi?

404 leht peaks edastama ka 404 HTTP koodi, sest siis teab otsirobot, et seda lehte ei peaks indekseerima.

Üldjuhul on 404 leht WordPressi kujunduses olemas ning lehel on õige olekukood. Kui aga oled loonud oma 404 lehe, siis tuleb 404 lehe päises määrata õige HTTP olekukood.

Kuidas kontrollida? Kontrollida saad veebilehitseja inspektoriga või mõne SEO tööriistaga.

404 lehe olekukood

Inspektoriga kontrollimiseks mine 404 lehele, selles näites on kasutatud Mozillat > tee lehel parem hiireklikk ja vali Inspect Element > liigu Network vahelehele > värskenda lehte > vali see rida, millel näed lehe URL-aadressi > vaata, mis koodi näed Status code real. Kui näed 404 koodi, siis on kõik korras.

2. Kas kõik kodulehe lingid töötavad?

Ikka võib juhtuda, et välised lingid lähevad katki või oled ise mingit sisemist linki muutnud, aga unustanud muuta sellele sisulehele viitavat linki.

Kodulehe külastaja jaoks on oluline, et navigeerimine ja sisu tarbimine oleks võimalikult mugav. Samuti ka otsiroboteid pole vaja saata uurima linke, mis on katki.

Kuidas kontrollida? Käsitsi linke kontrollida on päris ajamahukas, aga siiski võimalik. Märksa mugavam on taas kasutada spetsiaalset SEO tööriista, mis toob välja kõik lingid HTTP olekukoodiga 4xx või 5xx.

Võid aga ka kasutada mõnda veebipõhist tööriista, näiteks Online Broken Link Checker.

HTTP olekukoodide kohta võid lugeda postitust Puust ja punaseks: mida tähendavad Error 404, Redirect 301 ja muud olulised serverikoodid?

3. Kas robots.txt failis oled keelanud otsirobotitele juurdepääsu oma privaatsetele failidele või kataloogidele?

Kui hoiad oma kodulehel ka mõningaid privaatseid faile või katalooge, mis ei peaks olema leitavad otsirobotitele, siis tasub robots.txt faili lisada ka vastav käsk.

Kuidas kontrollida? Logi sisse Google Search Console’i > vali Crawl > robots.txt Tester. Vaata üle kõik read, mis algavad märksõnaga Disallow.

4. Kas tänan-lehtede indekseerimine otsingumootori poolt on keelatud?

Tänan-lehed on mõeldud eelkõige näitamiseks vormi täitjale ning seetõttu pole vaja, et nad ka otsitulemustes leitavad oleksid.

Kuidas kontrollida? Vaata oma tänan-lehtede lähtekoodi > otsi lehelt fraasi noindex.

Kui leiad vaste järgneval kujul, siis see tähendab, et selle lehe sisu ega linke ei indekseerita.

<meta name="robots" content="noindex,nofollow"/>

5. Kas sitemap sisaldab URL-aadresse, mis ei peaks seal olema?

Tavaliselt ei soovi me, et otsitulemustes oleks näha erinevad tänan-lehed, sest neid näitame ju külastjale peale vormi täitmist.

Mõnel juhul võime soovida ka, et maandumislehed ei tuleks otsitulemustes välja, eriti kui pakume e-postiaadressi vastu mingit väärtust.

Kuidas kontrollida? Logi Search Console’i > vali Crawl > Sitemaps > ava kodulehe sisukaart ning vaata, kas leiad sisulehtede nimekirjas URL-aadresse, mis ei peaks seal olema.

Google ignoreerib dubleeritud sisu

Dubleeritud sisu Google’i jaoks tähendab, kui terve leht on identne või oluline osa lehest on sarnane mõne teise sisulehega sinu enda kodulehel või mõne teise domeeni sisulehega.

Kui su kodulehel eksisteerib dubleeritud sisu, näiteks 2 teenuse lehte, mis on sisu poolest väga sarnased, siis tuleks kas:

  • kirjutada mõlemale teenuse lehele unikaalne tekst;
  • kaks sisulehte koondada üheks;
  • ühele teenuse lehele lisada noindex silt;
  • lisada peamisele sisulehele kanooniline link.

Kanooniline link on HTML element, mis annab teada otsirobotitele, et kuigi sisu on sarnane või identne teise lehega, siis indekseerida tuleb see sisuleht, mis on märgitud kanooniliseks lingiks.

Kui Google leiab dubleeritud sisu, millele pole lisatud kanoonilist linki või noindex silti, siis Google otsustab ise, millise sisulehe ta indekseerib.

Võib juhtuda, et Google ka karistab sind dubleeritud sisu eest ning seetõttu võivad sinu otsingutulemuste positsioonid langeda. Halvimal juhul võidakse ka terve koduleht otsingutulemustest eemaldada.

1. Kas dubleeritud sisulehtedele on lisatud kanoonilised lingid?

Kanoonilise linke saad sisulehtedele lisada näiteks Yoast SEO plugina abil, selleks tuleb dubleeritud sisulehel määrata, mis on kanooniliseks sisuleheks.

Pildil on näha Yoast SEO Advanced vaheleht, kus saad määrata kanoonilise lingi.

Kuidas kontrollida? Dubleeritud sisu leidmiseks saad kasuta veebipõhist tööriista Copyscape, kahjuks saad kontrollida vaid ühe sisulehe haaval, mitte tervet veebilehte korraga.

Kui oled kontrollinud oma peamised sisulehed ning leidnud dubleeritud sisu, siis ava oma kodulehel vastavad sisulehed. Vaata, kas sisulehtede lähtekoodist leiad kanoonilise lingi viited peamisele sisulehele.

Näide, sul on olemas kaks sarnase sisuga lehte:

  • https://sinudomeeninimi.ee/sisulehe-aadress (peamine sisuleht);
  • https://sinudomeeninimi.ee/sisulehe-aadress-uus.

Sel juhul peaks mõlema sisulehe lähtekoodis olema rida:

 <link rel="canonical" href="https://sinudomeeninimi.ee/sisulehe-aadress">.

2. Kas HTTP/HTTPS ning www ja ilma www-ta kodulehe aadress suunab külastaja primaarsele versioonile? Kas kasutad HTTPS protokolli?

Kui sinu leht on nähtav aadressiga HTTP/HTTPS või www/www-ta versioonis, siis see tähendab otsingumootorite jaoks, et tegemist on erinevate veebilehtedega ning seega dubleeriva sisuga.

HTTPS domeeninime ees tähendab, et tegemist on krüpteeritud andmevahetusega, mis on ka üheks otsingutulemuste reastamise kriteeriumiteks.

Kuidas kontrollida? Kirjuta veebilehitseja aadressireale oma kodulehe aadress kujul:

  • http://sinudomeeninimi.ee;
  • https://sinudomeeninimi.ee;
  • www.sinudomeeninimi.ee;
  • sinudomeeninimi.ee.

Igal juhul peaksid sa jõudma alati tulemuseni, milleks on sinu primaarne kodulehe aadress, mille aadress algab https:// eesliitega.

Lisaks kontrolli, et kõik olulised sisulehed algaksid https:// eesliitega, kui näed, et mõnel lehel see puudub, siis tuleks uurida sisulehe lähtekoodi, et näha, mis ressurss kasutab HTTP protokolli sisu edastamiseks.

Pildil on näha roheline tabalukk kodulehe aadressi ees, mis näitab, et tegemist on turvalise ühendusega. Ekraanipilt on tehtud Firefox Developer Edition veebilehitsejaga.

Edge veebilehitsejaga on tabalukk valget värvi ja Internet Exploreriga asub tabalukk aadressi lõpus ning on hallikat värvi.

Lõpetuseks

Selles postituses esitatud küsimused on vaid osa veebilehe auditist. Järgmistes veebilehe auditi postitustes vaatame, millistel tehnilistel põhjustel pole indekseeritud kodulehe sisu leitav soovitud märksõnadele ning lisaks esitan veel mõned küsimused seoses kodulehe tehnilise tervise ja turvalisusega.

Tahad, et teeksime sinu kodulehele süvaanalüüsi?

Kirjuta ja uurime, mida saab teha paremini.

  • Vastame esimesel võimalusel, kuid mitte hiljem kui 24 tunni jooksul.

Kui Sulle see postitus meeldis, siis palun jaga seda!

27.08.2018|

Autorist:

Häli on meie meeskonda kaua otsitud veebispetsialist, keda huvitab väga veebiprogrammeerimine ja kodulehe tegemine. Vabal ajal loeb palju raamatuid ning kannab hoolt oma isikliku raamatukogu eest.