Регистрация в поисковых системах


Обновление информации и создание новых разделов

Любой Web-сайт необходимо регулярно обновлять. Владельцы многочисленных ресурсов Интернета ведут в настоящее время ожесточенную борьбу за посетителей: конкуренция в Интернете чрезвычайно высока. Общее количество Web-страниц, размещенных во Всемирной сети, непрерывно растет, и статистика показывает, что вскоре оно может превысить значение двух html-документов на каждого пользователя Интернета. А посетители — это главное богатство владельца Web-сайта. Это аудитория, это имидж, это реклама, а в ряде случаев - и живые деньги. Хорошо, если пользователь заглянет на вашу страничку и изучит опубликованную на ней информацию, но еще лучше, если он вернется на нее снова. Вот почему регулярное обновление сайта является наипервейшей задачей каждого Web-мастера.

Традиционная методика обновления Web-сайта и создания на нем новых тематических разделов подразумевает подготовку необходимых файлов и html-документов в режиме offline на локальном компьютере с последующей публикацией их в Интернете либо с помощью браузера, посредством интерактивных средств сервера, предоставляющего вам Web-хостинг (если публикация возможна через Web-интерфейс), либо с использованием клиентского программного обеспечения, если вы располагаете доступом к удаленному серверу по протоколу FTP. Тем не менее данный процесс является весьма трудоемким и потребует от вас не только кропотливой работы, но и больших затрат времени. Можно ли упростить процедуру внесения тех или иных изменений в содержание вашего Web-сайта?

Да, безусловно, это возможно. Обычный механизм автоматизации процесса размещения информационных материалов на удаленном сервере подразумевает использование технологий CGI и SSI. Программные средства CGI берут на себя функции загрузки информации на узел Всемирной сети, а средства SSI динамически встраивают полученную информацию в существующий html-документили в заранее подготовленный шаблон. Очевидно, что данный подход потребует от вас, во-первых, хороших знаний в области программирования, а во-вторых, администраторского доступа к вашемуWeb-сайту для размещения, настройки и запуска соответствующих скриптов, что далеко не всегда возможно на серверах, предоставляющих бесплатный Web-хостинг. Как поступить? Выход достаточно прост: в качестве интерактивной системы для получения и преобразования подготовленной вами информации необходимо использовать простые и безотказные программные средства JavaScript.

 

Популярность... Это емкое слово не дает покоя каждому, кто хоть раз задумывался о своем месте в неспокойном нашем мире. Тем более если речь идет о популярности собственного Web-сайта в бескрайнем мире Интернета. Оставим в стороне этические аспекты этой проблемы: о моральном облике владельцев активно раскручиваемых страниц, перманентно находящихся в состоянии «underconstruction», писалось уже достаточно много. Обратимся непосредственно к практике.

Поисковые машины представляют собой специализированные серверы, предназначенные для поиска и аккумуляции информации по запросам пользователя. Следует различать тематические каталоги и собственно поисковые системы. Каталоги содержат обширный список ссылок на другие сайты, разбитых на несколько рубрик по тематической направленности. Общее число таких рубрик может достигать нескольких десятков. Процесс регистрации нового ресурса в информационном каталоге в общем случае выглядит следующим образом: владелец Web-страницы заполняет соответствующую интерактивную форму, включающую в себя сведения о тематике сайта, его названии, URL и ключевых словах, с помощью которых осуществляется поиск, после чего эта информация заносится в базу данных каталога. В ряде случаев модераторы сервера — сотрудники, призванные следить за соответствием регистрируемых ресурсов общим правилам данной интерактивной службы, — в течение нескольких дней проверяют страничку на предмет отсутствия в ее содержании запрещенной тематики, например, порнографии или призывов к насилию. Если запретные темы обнаружатся, ссылка на ваш ресурс будет безжалостно удалена из базы данных сервера, о чем вы получите соответствующее уведомление по электронной почте. Поиск по запросам пользователей ведется только в пределах базы данных самого информационного каталога. Результат работы системы отображается в файле отчета, который автоматически генерируется установленным на сервере сценарием CGI и содержит ссылки на найденные ресурсы, их названия и краткое описание.

Поисковые системы работают по совершенно иному принципу Используемый поисковой машиной CGI-скрипт, получив пользовательский запрос, обращается к независимым ресурсам Интернета и осуществляет поиск информации в самой Сети по тексту опубликованных на Web-серверах html-документов, последовательно проходя все обнаруженные гиперсвязи. Найденные таким образом Web-страницы некоторое время сохраняются на диске серверного компьютера на случай, если кто-либо из посетителей подаст поисковой службе аналогичный запрос.

Разумеется, поисковые серверы также располагают собственной базой данных, которая содержит в основном лишь ссылки на ресурсы Интернета. Интерактивные сценарии системы самостоятельно обращаются к каждому сайту, ссылка на который имеется в базе данных, разыскивают в его тексте введенные автором запроса ключевые слова и включают ссылки на данную страницу в файл отчета. Затем робот последовательно проходит по всем гиперссылкам, обнаруженным на этой странице, и если связанные с ней ресурсы отсутствуют в базе данных(индексе) поискового сервера, информация о них автоматически заносится виндекс. Этот процесс называется индексацией сайта. Смысл регистрации в поисковой машине сводится не только к тому, чтобы ссылка на ваш ресурс была внесена в базу данных сервера и прошла процедуру индексации. Желательно, чтобы информация о вашей страничке попала в кэш серверного компьютера, поскольку поиск осуществляется в первую очередь по хранящимся на его дисках данным, затем — по имеющимся в базе ссылкам и лишь в последнюю очередь —непосредственно в Интернете.

Для повышения релевантности поиска, то есть максимального соответствия отчета введенному пользователем запросу, многие поисковые машины применяют так называемые эвристические методы обработки информации. Например, получив пользовательский запрос «Куда пойти сегодня вечером?», поисковая машина самостоятельно просклоняет глагол «пойти», создаст все возможные варианты слова («идти», «иду», «идет», «идешь», «пойдет» и т. д.) и продолжит поиск уже по расширенному подобным образом запросу. Именно поэтому нет смысла указывать в перечне ключевых слов, записываемых в МЕТА-теге вашего документа, решительно все варианты. Этим вы лишь перегрузите суммарный объем html-файла, не добившись никаких преимуществ. Пользователь может пожеланию ограничить диапазон поиска, исключив из него ресурсы какого-либо домена или определив в тексте запроса специальные директивы для поисковой машины. Набор таких директив может варьироваться в зависимости от алгоритмов обработки информации, используемых каждым поисковым сервером.