парсер сайтов что это



Парсинг сайтов что это

Автор XXXXXXXXX задал вопрос в разделе Интернет

Что даёт парсинг Google?и что это вообще такое? и получил лучший ответ

Ответ от
Зачем нужен прасер?
Ответ заключен в вопросе. Парсер нужен для парсинга.
А что такое парсинг? А парсинг – это процесс сбора неких данных и составления из них базы. Например, можно собрать базу гостевых книг. Или базу каталогов сайтов. Вот зачем это делать и делать ли вообще – каждый решает сам. Чаще всего такие базы используются спамерами. Но не обязательно. Прогон сайта по каталогам, например, спамом не назовешь, т. к. каталоги для того и делают, чтоб в них сайты регистрировали.
Рассмотрим подробнее.
Итак, мы хотим собрать свою собственную базу гостевых книг…
Но записывать в базу адреса морд сайтов, у которых есть гостевые смысла нет. Потому что навигация у всех сайтов разная, оформление – тоже. В общем, придется нам тогда заходить на каждый сайт, искать ссылку на гостевую и только потом убеждаться, что ссылку в ней оставить не получится и время и траф потрачены зря.
Поэтому мы будем записывать в нашу базу сразу адреса страниц, где вводят комментарий.
Причем только для таких гостевых, где можно оставить ссылку.
Как найти такие гостевухи?
Найти нужно одну. Такую, какая нам нужна. Вспомним, что мало кто пишет собственные скрипты для таких вещей как гостевые или каталоги. Большинство вебмастеров пользуются готовыми и это нам на руку. У одинаковых скриптов одинаковы и принципы адресации страниц, а значит мы можем найти гостевые, используя эти одинаковости.
Например, хоти мы напарсить базу гоствух, расположенных «на народе» . У всех этих гостевых есть одинаковый кусок адреса – «narod.ru/guestbook/?owner». Вот этим-то мы и воспользуемся для парсинга – скормим парсеру запрос вида «inurl:narod.ru/guestbook/?owner» и сохраним результаты поиска.
Аналогично мы можем парсить выдачу любого другого запроса и искать гостевые, работающие на разных скриптах. И не только гостевые…
Ну, а что делать с такой базой – это, как говорилось выше, дело Ваше!

Ответ от Даниил Плотнерчук[гуру]
а ты по пользуйся и узнаешь, отличная программа

Ответ от Иван[активный]
В информатике, синтакси́ческий ана́лиз (па́рсинг) — это процесс сопоставления линейной последовательности лексем (слов, токенов) языка с его формальной грамматикой. Результатом обычно является дерево разбора. Обычно применяется совместно с лексическим анализом. Синтаксический анализатор (парсер) — это программа или часть программы, выполняющая синтаксический анализ.
Пример разбора выражения в деревоПри парсинге исходный текст преобразуется в структуру данных, обычно — в дерево, которое отражает синтаксическую структуру входной последовательности и хорошо подходит для дальнейшей обработки.
Как правило, результатом синтаксического анализа является синтаксическая структура предложения, представленная либо в виде дерева зависимостей, либо в виде дерева составляющих, либо в виде некоторой комбинации первого и второго способов представления.

Ответ от Parq1[новичек]
для примера можешь на пхп попробовать, простым языком тут пишут

Ответ от 3 ответа[гуру]
Привет! Вот подборка тем с похожими вопросами и ответами на Ваш вопрос: Что даёт парсинг Google?и что это вообще такое?
Parser на Википедии
Посмотрите статью на википедии про Parser
Склеральные линзы на Википедии
Посмотрите статью на википедии про Склеральные линзы
 

Ответить на вопрос:

Имя*

E-mail:*

Текст ответа:*
Проверочный код(введите 22):*