
Определение и принцип работы Noindex
Noindex — это директива, используемая для запрета индексации определенных страниц поисковыми системами. Когда поисковый робот видит этот атрибут, он исключает страницу из индекса, и она перестает появляться в результатах поиска.
Способы добавления Noindex
- В мета-тегах HTML-документа.
- В файле robots.txt.
- Через HTTP-заголовки сервера.
Однако, важно понимать, что Noindex не блокирует доступ к странице, а лишь запрещает ее добавление в индекс поисковых систем. Если страница закрыта только Noindex, но при этом на нее ведут ссылки с других ресурсов, поисковик все равно сможет ее обойти, но не сохранит в своей базе.
Где и как применяется Noindex
Использование в мета-теге robots
Наиболее распространенный способ — добавление meta-тега Noindex в код страницы. Пример:
<meta name="robots" content="noindex, follow">
Этот тег сообщает поисковым системам, что страницу не нужно индексировать, но ссылки на ней могут учитываться.
Если же добавить nofollow, то поисковик не только не будет индексировать страницу, но и не будет переходить по ссылкам на ней:
<meta name="robots" content="noindex, nofollow">
Применение в файле robots.txt
Можно запретить индексацию страницы через robots.txt, но это работает иначе:
User-agent: *
Disallow: /private-page/
Этот метод не равен Noindex. Он запрещает поисковым роботам заходить на страницу, но если на нее есть внешние ссылки, она все равно может попасть в индекс.
Использование HTTP-заголовков
Этот метод удобен, если страница динамически создается на сервере. Добавление в HTTP-заголовок:
X-Robots-Tag: noindex, nofollow
Этот метод полезен для закрытия PDF-документов, XML-файлов и других ресурсов, где нельзя добавить мета-тег.