Запрет индексации
Автор Кирилл Соловьев задал вопрос в разделе Другие языки и технологии
о работе с файлом robots.txt и получил лучший ответ
Ответ от Koala[активный]
Символ # используется для обозначения начала комментария (текст, игнорируемый роботом) . Например:
User-agent: * #Запрет индексации папки cgi
Disallow: /cgi/
Пример 1. Разрешаем индексировать все страницы сайта всем поисковикам (примечание: эквивалентом данной инструкции будет пустой файл robots.txt):
User-agent: *
Disallow:
Пример 2. Запрещаем индексировать все страницы сайта всем поисковикам:
User-agent: *
Disallow: /
Пример 3. Разрешаем индексировать всем кроме Яндекса:
User-agent: Yandex
Disallow: /
Пример 4. Запрещаем индексировать всем поисковикам кроме Яндекса (примечание: обратите внимание на обязательную пустую строку между двумя инструкциями, без нее файл не будет воспринят правильно)
User-agent: Yandex
Disallow:
User-agent: *
Disallow: /
Пример 5. Яндексу запрещаем индексировать папки cgi и images, а Апорту файлы myfile1.htm и myfile2.htm в директории dir
User-agent: Yandex
Disallow: /cgi/
Disallow: /images/
User-agent: Aport
Disallow: myfile1.htm
Disallow: myfile2.htm
Пример 6. Весьма актуальная проблема. Запрещаем индексировать динамические ссылки, пример (?ul=…) всем поисковикам:
User-agent: *
Disallow: /*?sl* #Запрет индексации динамических ссылок
Пример 7. Указание значения для Disallow без открывающего слеша приведет к тому, что робот пропустит не только папки с таким именем, но и файлы. В следующем примере, роботы не будут индексировать папку с именем myfile, а также все файлы, имеющие данное имя например myfile.php.
User-agent: *
Disallow: myfile
Пример 8. Итоговый пример файла robots.txt
User-agent: * #Запрет индексации папок cgi и images для всех поисковиков
Disallow: /cgi/
Disallow: /images/
User-agent: Google #Запрет индексации файлов myfile1.htm и myfile2.htm для Google
Disallow: myfile1.htm
Disallow: myfile2.htm
User-agent: * #Запрет индексации файлов spisok.php и vsakaya-fignya.php для всех поисковиков
Disallow: spisok.php
Disallow: vsakaya-fignya.php
User-agent: *
Disallow: /*?sl* #Запрет индексации динамических ссылок с переменной sl
При правильном использовании robots.txt у вас не должно возникнуть проблем с поисковиками, но могут возникнуть сложности со слишком любопытными посетителями. Дело в том, что они спокойно могут просмотреть содержимое файла, введя в адресную строку сайта/robots.txt. Увидев, какие файлы и папки вы скрываете, они решат обратить свой взор именно на эти части сайта, заинтересовавшись, что же вы там хотели спрятать.
Что такое robots.txt и sitemap.xml???
robots.txt- файл для разрешения или запрета индексации страниц поисковиками
sitemap.xml -
подробнее...
Почему при загрузке файла в торренте пишет Ошибка: Отказано в доступе? ? ( Винда 7 )
Причина:
К файлу обращается стороннее приложение/процесс. Возможно это дефрагментатор,
подробнее...
Что означает в настройках вида папки "Разрешить индексирование папки для быстрого поиска"? Что значит "индексирование"?
Приветствую)
Это технология, позволяющая операционной системе находить файлы, при запросе
подробнее...
uTorent начинаю качать пишет ошибку Процесс не может получить доступ к файлу, так как этот файл занят другим процессом (
Ошибка: Процесс не может получить доступ к файлу, так как файл занят другим процессом.
подробнее...
можно ли на сайте "Одноклассники" скрыть друга, как в контакте?
Социальные сети постоянно развиваются, преподнося нам что-то новое в виде дополнительных функций
подробнее...
в 2016г будет отмена материнского капитала и индексации пенсий, какие еще законы вы знаете ?
сегодняшний пилот соц. норм на водуэлектричество планирует повсеместно вступить в силу с 1 июля
подробнее...
Почему денег нет на индексацию пенсий и зарплат, а сотни миллиардов воруют и вывозят за границу?
Почему ты этот вопрос Путину не задавал???Андрей
Искусственный Интеллект
подробнее...
судебные приставы исполнители
исполнительный сбор, индексация, меры предварительного воздействия; запрет на выезд, аренст на рег
подробнее...
Что должно быть в robots.txt чтобы быстро яндекс индексировал сайт?
Помоему етот файл robots.txt наоборот для запрета поисковикам индексировать конкретные страницы
подробнее...
Где находится файл robots.txt на сайте ucoz???
В корне. А вообще, в правилах Юкоза написано русским языком: не знаете, как работает robots - не
подробнее...
Индексирование сайта.
к примеру на ucoz файл robots.txt создается только через месяц после создания сайтаanon
подробнее...
Что значит заморозка пенсионных накоплений?
значит платить взносы будете - но в замен - дуля от вовы
charli bob
подробнее...
Как узнать по какой ссылке переходят или уходят посетители с моего сайта.В счетчиках этой статистики не нашел....
Есть такие счетчики правда они платные, я про то что бы посмотреть куда уходят,. .
А откуда
подробнее...