Nenadno veliko število strani v indeksu v spletni trgovini

V eni večji spletni trgovini, kjer smo do sedaj imeli povprečno indeksiranih cca 300.000 strani (kar je željen rezultat), je kar naenkrat v roku 1-2 mesecev drastično skočilo število indeksiranih strani na 1.700.000, kar vsekakor ni vredu.

Od dneva, ko se je to pričelo drastično povečevati nismo delali sprememb v kodi ali front-end konfiguraciji, kvečemu obratno, raznoraznim filtrom smo pričeli nameščati nofollow like, kot tudi "NOINDEX, NOFOLLOW" tage, da bi to zajezili. Ni pa pomagalo in indeks se je konstantno povečeval.

Sedaj se nam porajajo sledeča vprašanja in bi bilo zelo veseli kakšnega odgovora ali namiga.

  1. V Webmaster Tools ne najdemo možnosti izvoza indeksa, ki ga ima Google. Oziroma še boljše ugotoviti katere so bile indeksirane strani vse od tega drastičnega porasta? "Site:" nam ne pride v poštev, ker je tega preveč.
  2. Opazili smo veliko število indeksiranih strani kot so "www.nekaj.si/kategorija.html?limit=40 , www.nekaj.si/kategorija.html?limit=60", čeprav imamo na takih ureljih urejene CANONICAL tage. Očitno CANONICAL tag ne deluje?
  3. Kako v robots.txt preprečiti indeksiranje URL-jev, ki vsebujejo parametre? Oziroma kako najbolj učinkovito preprečiti indeksiranje URL-jev z parametrom, da ne pride do indeksiranja strani z isto vsebino.

V naprej hvala za pomoč =)

5 odgovorov

1 1

Več stvari je tukaj.

To, da imate canonical ne pomeni, da jih G ne bo poindeksiral in pokazal v GSC. Tako da ta report potem postane irrelevant, ker ti noter kaže stvari za katere si mu rekel, naj jih ignorira. Če imaš canonical prav, potem je good.

Za nastavitve indeksiranja parametrov pa imaš v GSC Crawl - URL Parameters. In tam greš lepo parameter po parameter, nastaviš naj ga ne indexira (sej ti pokaže tudi primer URLjev) in tako stvari zmanjšaš.

Aja, ne G ti ne bo pokazal kaj ima indeksirano, ker ... tak pač je. Pogosto je pomagalo da smo gledali reporte v Search Appearance - HTML improvements, kjer ti pokaže duplicated meta title in description. Tam ti pogosto pokaže random URLje ki jih indeksira, pa ti veš da jih ne rabi. Canonical tudi tukaj ne upošteva, tako da je kr kaos.

In še tole. Imaš v Google Index - Index status tudi Blocked by robots, če greš pod Advanced. Če pa imaš že nov GSC, boš pod Index coverage dobil še bolj natančne podatke o različnih URLjih z različnimi statusi...

Nazadnje urejal Preseren (10. maj ob 15:10)

Objava umaknjena – Preseren 10. maj ob 19:42
0

http://inchoo.net/online-marketing/magento-seo-how-to-handle-problems-caused-by-layered-navigation/ ?

Objava umaknjena – blindek 14. maj ob 09:47
0

Sam pazi, tale post od Inchoo bloga je precej star, poglej še komentarje, kjer se priporočilo spremeni.