Každý webmaster ví, že aby lidé mohli začít navštěvovat jeho zdroj z vyhledávačů, musí být indexován. O tom, co je indexování stránek, jak se provádí a jaký je jeho význam, si řekneme v tomto článku.
Co je indexování?
Slovo „indexování“tedy samo o sobě znamená vložení něčeho do registru, soupisu materiálů, které jsou k dispozici. Stejný princip platí pro indexování stránek. Tento proces lze ve skutečnosti nazvat také zadávání informací o internetových zdrojích do databáze vyhledávačů.
Jakmile tedy uživatel zadá do vyhledávacího pole Google jinou frázi, skript mu vrátí výsledek, včetně názvu vašeho webu a jeho stručného popisu, který vidíme níže.
Jak se provádí indexování?
Samotné indexování ("Yandex" je, nebo Google - nehraje roli) je docela jednoduché. Celý web internetu, zaměřený na databázi IP adres, které mají vyhledávače, je skenován výkonnými roboty – „pavouky“, kteří sbírajíinformace o vašem webu. Každý z vyhledávačů jich má obrovské množství a fungují automaticky 24 hodin denně. Jejich úkolem je přejít na váš web a „přečíst“si na něm veškerý obsah a přitom zadávat data do databáze.
V důsledku toho teoreticky indexování stránek příliš nezávisí na vlastníkovi zdroje. Rozhodujícím faktorem je zde vyhledávací robot, který na stránku přijde a prozkoumá ji. Právě to ovlivňuje, jak rychle se váš web objeví ve výsledcích vyhledávání.
Pojmy indexování?
Pro každého webmastera je samozřejmě výhodné, když se jeho zdroj objeví ve výsledcích vyhledávání co nejrychleji. To ovlivní za prvé podmínky pro uvedení webu na první pozice a za druhé, kdy začnou první fáze monetizace webu. Čím dříve tedy vyhledávací robot „sežere“všechny stránky vašeho zdroje, tím lépe.
Každý vyhledávač má svůj vlastní algoritmus pro zadávání dat stránek do své databáze. Například indexování stránek v Yandexu se provádí ve fázích: roboti neustále skenují stránky, poté uspořádají informace, po kterých dojde k takzvané „aktualizaci“, když se všechny změny projeví. Pravidelnost takových akcí není společností stanovena: konají se jednou za 5-7 dní (zpravidla), mohou se však konat 2 i 15 dní předem.
Současně se indexování webu v Google řídí jiným modelem. V tomto vyhledávači takové „aktualizace“(základní aktualizace) probíhají pravidelně, proto pokaždé počkejte, až roboty zadají informace do databáze, a pakbude objednáno každých pár dní, není potřeba.
Na základě výše uvedeného můžeme vyvodit následující závěr: stránky v Yandexu se přidávají po 1–2 „aktualizacích“(tj. v průměru za 7–20 dní) a na Googlu se to může stát mnohem rychleji - doslova za den.
Zároveň má samozřejmě každý vyhledávač své vlastní zvláštnosti, jak indexování probíhá. Yandex má například takzvaného „fast bota“– robota, který dokáže zadávat data do problematiky za pár hodin. Pravda, není snadné přimět ho, aby navštívil váš zdroj: týká se to hlavně zpráv a různých významných událostí vyvíjejících se v reálném čase.
Jak se dostat do indexu?
Odpověď na otázku, jak indexovat své stránky ve vyhledávačích, je jednoduchá i složitá. Indexování stránek je přirozený jev, a pokud o tom ani nepřemýšlíte, ale prostě, řekněme, udržujte svůj blog a postupně jej naplňujte informacemi, vyhledávače váš obsah časem dokonale „shltnou“.
Další věc je, když potřebujete urychlit indexaci stránek, například pokud máte síť tzv. „satelitů“(stránky určené k prodeji odkazů nebo umístění reklam, jejichž kvalita je obvykle horší). V takovém případě musíte přijmout opatření, aby si roboti vašeho webu všimli. Za běžné jsou považovány následující: přidání adresy URL webu do speciálního formuláře (nazývá se „AddUrl“); spuštění adresy zdroje přes adresáře odkazů; přidat adresu do adresářůzáložky a další. Na SEO fórech se vedou četné diskuse o tom, jak každá z těchto metod funguje. Jak ukazuje praxe, každý případ je jedinečný a je obtížné přesněji najít důvody, proč byl jeden web indexován za 10 dní a druhý za 2 měsíce.
Jak urychlit vstup do indexu?
Logika rychlejšího zařazení webu do indexu je však založena na odkazu na něj. Zejména mluvíme o nastavení URL na bezplatných a veřejných stránkách (záložky, adresáře, blogy, fóra); o nákupu odkazů na velkých a populárních stránkách (například pomocí burzy Sape); stejně jako přidání mapy webu do formuláře addURL. Možná existují i jiné metody, ale ty, které již byly uvedeny, lze bezpečně nazvat nejoblíbenějšími. Připomeňme, že obecně vše závisí na webu a štěstí jeho vlastníka.
Které stránky jsou indexovány?
Podle oficiální pozice všech vyhledávačů se do indexu dostanou stránky, které projdou řadou filtrů. Nikdo neví, jaké požadavky ten druhý obsahuje. Ví se jen, že se časem všechny vylepšují tak, že odfiltrují pseudostránky vytvořené za účelem výdělku prodejem odkazů a dalších zdrojů, které uživateli nenesou užitečné informace. Pro tvůrce těchto stránek je samozřejmě hlavním úkolem co nejvíce indexovat stránky (přilákat návštěvníky, prodat odkazy atd.).další).
Jaké zdroje vyhledávače zakazují?
Na základě předchozích informací můžeme usuzovat, které stránky se s největší pravděpodobností do SERPů nedostanou. Stejné informace vyjadřují oficiální zástupci vyhledávačů. Především se jedná o stránky obsahující nejedinečný, automaticky generovaný obsah, který není pro návštěvníky užitečný. Následují zdroje, ve kterých je minimum informací, vytvořené k prodeji odkazů a tak dále.
Je pravda, že pokud analyzujete výsledky vyhledávačů, najdete v nich všechny tyto stránky. Pokud tedy mluvíme o webech, které nebudou ve výsledcích vyhledávání přítomny, měli bychom si všímat nejen nejedinečného obsahu, ale také řady dalších faktorů – mnoho odkazů, nevhodně organizovaná struktura a tak dále.
Skrytí obsahu. Jak zakázat indexování stránek?
Vyhledávače procházejí veškerý obsah na webu. Existuje však technika, pomocí které můžete omezit přístup vyhledávacích robotů k určité sekci. To se provádí pomocí souboru robots.txt, na který reagují "pavouci" vyhledávačů.
Pokud je tento soubor umístěn v kořenovém adresáři webu, bude indexování stránek probíhat podle skriptu, který je v něm napsán. Konkrétně indexování můžete zakázat jediným příkazem – Disallow. Kromě toho může soubor také specifikovat části webu, na které se bude tento zákaz vztahovat. Chcete-li například zakázat index celého webu, stačí zadatjedno lomítko "/"; a pro vyloučení sekce „shop“z výsledků vyhledávání stačí zadat ve vašem souboru následující charakteristiku: „/shop“. Jak vidíte, vše je logické a extrémně jednoduché. Indexování stránek se zavírá velmi snadno. Zároveň vaši stránku navštěvují vyhledávací roboti, čtou robots.txt a nevkládají data do databáze. Takže můžete snadno manipulovat, abyste viděli určité charakteristiky stránek ve vyhledávání. Nyní si promluvme o tom, jak se kontroluje index.
Jak mohu zkontrolovat indexování stránky?
Existuje několik způsobů, jak zjistit, kolik a které stránky se nacházejí v databázi Yandex nebo Google. První - nejjednodušší - je nastavit odpovídající požadavek ve vyhledávacím formuláři. Vypadá to takto: site:domen.ru, kde místo domen.ru napíšete adresu svého webu. Když zadáte takový požadavek, vyhledávač zobrazí všechny výsledky (stránky) umístěné na zadané URL. Kromě toho, že jednoduše vypíšete všechny stránky, můžete také vidět celkový počet indexovaných materiálů (napravo od fráze "Počet výsledků").
Druhým způsobem je kontrola indexování stránek pomocí specializovaných služeb. Nyní je jich velké množství, mimochodem je lze nazývat xseo.in a cy-pr.com. Na takových zdrojích můžete nejen vidět celkový počet stránek, ale také určit kvalitu některých z nich. To však potřebujete pouze v případě, že tomuto tématu rozumíte hlouběji. Zpravidla se jedná o profesionální nástroje SEO.
O "nuceném" indexování
Rád bych také napsal něco málo o tzv„Vynucené“indexování, kdy se člověk snaží zahnat svůj web do indexu pomocí různých „agresivních“metod. Optimalizátoři to nedoporučují.
Vyhledávače, které si alespoň všimnou nadměrné aktivity spojené s novým zdrojem, mohou uvalit určitý druh sankcí, které negativně ovlivní stav webu. Proto je lepší udělat vše pro to, aby indexování stránek vypadalo co nejorganičtěji, pozvolněji a plynule.