МЕХАНИЗМ РАБОТЫ ПОИСКОВЫХ СИСТЕМ
Передача файлов с помощью протокола FTP
Назначение электронной почты — прежде всего обмен текстовой информацией между различными компьютерными системами. Не меньший интерес для пользователей сети Internet представляет обмен отдельными файлами и целыми программами.
Для того чтобы обеспечить перемещение данных между различными операционными системами, которые могут встретиться в Internet, используется протокол FTP (File Transfer Protocol), работающий независимо от применяемого оборудования. Протокол обеспечивает способ перемещения файлов между двумя компьютерами и позволяет абоненту сети Internet получить в свое распоряжение множество файлов. Пользователь получает доступ к различным файлам и программам, хранящимся на компьютерах, подключенных к сети.
Программа, реализующая этот протокол, позволяет установить связь с одним из множества FTP-серверов в Internet.
FTP-сервер — компьютер, на котором содержатся файлы, предназначенные для открытого доступа.
Программа FTP-клиент не только реализует протокол передачи данных, но и поддерживает набор команд, которые используются для просмотра каталога FTP-сервера, поиска файлов и управления перемещением данных.
Ниже будут рассмотрены механизмы, используемые Google при индексировании и выдаче результатов запроса. Познакомившись с этими механизмами, можно научиться управлять поведением поисковой машины.
«Что для Вас является решающим фактором в работе поисковика?
Единственное, что нас интересует в поиске информации, - это релевантность ссылок. Упорядоченность нашей базы данных - забота номер два, но и она напрямую связана с единственным качественным показателем работы поисковой машины - релевантностью.»
Сергей Брин, президент Google Inc.
Google - это поисковая система, которая использует количество ссылок на веб-сайт, как основной параметр популярности сайта. Это является особенно полезным в поиске хороших сайтов при простых поисковых запросах, например "автомобиль" или "путешествие". Именно поэтому Google приобрел большую славу за релевантность своих ссылок.
Индекс цитирования (link popularity) - это количество ссылок, ведущих на ваш сайт с других сайтов. Этот метод сейчас широко используется поисковыми системами для ранжирования сайтов, так как можно предположить, что если на ваш сайт ведет множество ссылок, то содержимое вашего сайта является интересным и в чем-то уникальным. Индекс цитирования - это популярность сайта.
Важность наличия ссылок на ваш сайт можно процитировать словами представителя Inktomi (чьей базой данных пользуются такие поисковые системы как Hotbot, AOL, MSN, Yahoo, Snap, Goto, Iwon): "если на ваш сайт нет ни одной ссылки, он проживет не более, чем один цикл обновления нашей базы данных". Чем большее количество ссылок существует на ваш сайт, тем лучший рейтинг он получает.
Кроме количества ссылок, при расчете индекса цитирования учитывается качество ссылок. Это включает в себя три момента:
1. Откуда идет ссылка. Например, если ссылка на ваш сайт идет с каталога Yahoo, то "вес" этой ссылки будет гораздо больше, чем если бы ссылка шла с сайта http://www.geosites.com/users/~vasya-pupkin. Многие сайты получали увеличение своих рейтингов в поисковых системах после того, как регистрировались в таких общепризнанных каталогах как Yahoo.
2. Тематическая надпись на ссылке. Многие поисковые системы анализируют релевантность содержимого ссылки и сайта, на который она ведет. То есть, если на ссылке написано "поиск и поисковые системы в интернет", а сайт, куда она ведет так же посвящен "поиску и поисковым системам в интернет", то ссылка приобретает дополнительный "вес".
3. Тематическая принадлежность сайта, откуда идет ссылка. Поисковые системы часто анализируют, с каких сайтов идут ссылки на ваш сайт. То есть 10 ссылок с сайтов, которые посвящены поисковым системам, будут гораздо ценнее, чем 100 ссылок с сайтов, которые не имеют никакого отношения к тематике вашего сайта. Следует, однако, отметить, что далеко не во всех поисковых системах реализован данный механизм.
Способы увеличения "индекса цитирования" сайта
1. Существует хороший способ улучшить свой индекс цитирования. Для этого вам надо зарегистрировать ваш сайт во всех основных поисковых каталогах. После этого найдите ваш сайт в каталоге и скопируйте точный адрес URL, по которому находится ваш сайт в каталоге. Затем установите на своих страницах "скрытые ссылки" на этот адрес. В этом случае поисковые системы без труда найдут адрес вашего сайта в поисковых каталогах и улучшат ваш рейтинг.
2. Обмен ссылками. Если вы нашли интересный сайт, который, как вы считаете, будет полезным для вашей аудитории, не стесняйтесь написать письмо администратору этого сайта с просьбой об обмене ссылками. Большинство людей с удовольствием обменяются ссылками, вы даже можете приобрести хороших друзей.
3. Участие в клубах по обмену ссылками. Существует достаточно большое количество таких клубов. Попробуйте поискать их в англоязычной части интернета по ключевым словам "link clubs".
Коэффицент Page Rank
«Технология поиска PageRank компании Google работает путем, в первую очередь, установления структуры ссылок во всей сети, а затем ранжируя каждую отдельную страницу, основываясь на числе и значимости ссылок на нее на других страницах».
Мэт Катс (Matt Cuts), инженер по программному обеспечению Google.
Page Rank в Google - один из основополагающих факторов, влияющих на релевантность страницы. Google воспринимает ссылку со страницы А на страницу В как голос, отданный страницей А в поддержку страницы В. Однако учитывается не только количество ссылок, полученных страницей В, но также качество этих ссылок.
Нужно отметить, что Page Rank учитывает ссылки между страницами, а не между доменами, поэтому у страниц с одного домена может быть разный Page Rank, причем ссылки между страницами внутри домена тоже учитываются при определении Page Rank. Очень часто сайты строятся таким образом, что большинство страниц внутри домена ссылаются на корневую страницу, а также внешние ссылки в большинстве своем ведут на корень, поэтому наибольший Page Rank может быть именно у корневой страницы.
Вычисление Page Rank R (A)= C*(R (B1)/N1+…+R (Bi)/Ni) - общая формула вычисления Page Rank
Page Rank страницы A, на которую ссылаются страницы В1…Вi, основан на определении суммы частных R (Bi)/Ni, где R (Bi) - Page Rank страницы Bi, Ni - кол-во ссылок на этой странице. С - некий коэффициент сглаживания, он присваивается странице или группе страниц и может использоваться для предотвращения преднамеренного ввода в заблуждение системы, для того чтобы получить больший Page Rank.
Из формулы видно следующее:
· Чем больше ссылок с других страниц, тем выше Page Rank.
· Чем выше Page Rank ссылающихся страниц, тем выше Page Rank.
· Чем меньше количество ссылок на ссылающейся странице, тем выше Page Rank.
Еще можно заметить, что страницы внутри домена в некотором роде наследуют Page Rank корневой страницы. Например: имеется популярный сайт, на который ссылаются страницы с других доменов. Скорее всего, большинство ссылок ведут на корневую страницу и поэтому у неё большой Page Rank, в свою очередь, на корневой странице присутствует навигация по сайту. Page Rank страницы, на которую ссылается корень будет: R (корня)/N (ссылок из корня) - тоже довольно большой. Поэтому ссылки со страниц популярных сайтов имеют большой Page Rank.
Общая формула определения рейтинга страницы, не учитывающая текстовое содержание, будет примерно следующая:
Score=WA*Naccess + WR*Page Rank + WB*Nbacklinks + WF*Nforwardlink
Где:
WA - вес кол-ва входов на страницу (т.е. общее кол-во ссылок с разных мест страницы, с разных страниц)
WR - вес показателя Page Rank
WB - вес кол-ва ссылок с других страниц
WF - вес кол-ва ссылок со страницы на другие
Из всего выше сказанного следуют простые умозаключения:
Чем ближе к корню страница со ссылкой, тем больший вес она даст, но лучше всего получить ссылку с корневой страницы сайта.
Чем лучше организована навигация по сайту, тем больший вес будут иметь страницы.
PageRank позволяет эффективно отличить высококачественные страницы Web от низкокачественных, и данный параметр используется в механизме поиска Google.
Глава 5. Информационные системы управления проектами
Современные методы управления проектами уходят корнями в 50-е годы ХХ в. Практически одновременно две проектные группы представили методы управления сложными комплексами работ.
Компании Du Pont и Remington Rand предложили «метод критического пути» (Critical Path Method, CРМ), который получил наибольшее распространение. Суть метода заключается в том, что, зная логику выполнения и длительность работ, рассчитывают наиболее раннюю дату завершения проекта и определяют критический путь, т. е. выявляют работы, которые имеют нулевой резерв времени.
Современные представления о методах управления проектами собраны в своде знаний об управлении проектами (Project Management Body of Knowledge, PMBOK). Структура и содержание РМВОК в разных странах может отличаться, так как многие национальные ассоциации управления проектами имеют неодинаковые точки зрения на содержание этого документа.
Опираясь на общепринятый метод организации процесса планирования, его можно представить в виде этапов, взаимосвязь которых показана на рис. 5.6. Все этапы планирования являются многоитеративными процессами и повторяются несколько раз, до тех пор, пока не будет получен необходимый результат. Этапы планирования имеют следующее содержание.
Планирование целей (Scope Planning) - разработка документа, в котором определены цели проекта. Отправной точкой служат описание продукта. Обоснование проекта, общие ограничения, информация об уже выполненных аналогичных проектах.
Рис. 5.6. Основные этапы планирования
Анализируются альтернативные пути реализации проекта, определяются критерии успешности. Этот этап планирования осуществляется до применения пакетов управления проектами, а документ, созданный на этом этапе, служит основой для всех проектных решении и единого понимания целей проекта всеми его участниками.
Декомпозиция целей (Scope Definition) — последовательное деление основных результатов проекта на более мелкие элементы, вплоть до пакетов работ, хорошо поддающихся управлению. В итоге получается иерархическая структура (дерево) работ проекта (Work Breakdown Structure, WBS).
Определение операций (Activity Definition) — определение перечня элементарных операций (activity), которые должны быть выполнены для достижения результатов, описанных в WBS.
Планирование ресурсов (Resource Planning). Определение того, какие именно ресурсы (люди, оборудование, материалы) и в каком количестве потребуются для выполнения запланированных работ. Учитываются ограничения, связанные с политикой компании по кадровым вопросам, уровнем запасов, использованием оборудования и т. д., а также (обязательно) оценочные данные о стоимости использования ресурсов.
Определение взаимосвязи операций (Activity Sequencing) — определение последовательности проведения работ в проекте с учетом технологических, организационных и других ограничений. Одни работы могут выполняться параллельно, другие же, напротив, могут начаться не раньше, чем завершатся предшествующие. Результатом этого этапа является сетевая диаграмма (project network diagram), которая показывает логическую взаимосвязь между работами в проекте (часто ее некорректно называют PERT-диаграммой).
Оценка длительности операций (Activity Duration Estimating) — определение количества рабочею времени, которое необходимо дли выполнения каждой элементарной операции. Расчет времени производится на основании экспертных оценок и моделирования (метод Монте-Карло). Учитываются ресурсные и другие ограничения.
Оценка стоимости (Соst Estimating) - определение стоимости ресурсов, необходимых для выполнения проекта. Рассматриваются различные ценовые альтернативы, В результате разрабатывается план управления стоимостью проекта, для тою чтобы она не вышла на рамки ограничений.
Составление расписания (Schedule Development) — определение дат старта и финиша для всех работ проекта. Оцениваются реалистичность расписания (project schedule), загрузка ресурсов и их влияние на срок выполнения проекта.
Разработка бюджета (Cost Budgeting) — определение базисной линии стоимости проекта, называемой S-кривой из-за ее сходства с латинской буквой S. Базисная линия показывает распределение во времени (нарастающим итогом) расходов на проект и служит для сравнения текущих результатов с плановыми.
Разработка плана проекта (Project Plan Development) — создание итогового структурированного документа на основании данных, полученных на предыдущих этапах планирования. Результатом является план проекта, который служит руководством для исполнения и управления им.
Для организации работы над проектом создают группы сотрудников (уровни пользователей), ответственных за формирование соответствующей части проекта:
1. Высшее руководство (Executive level — уровень вашего руководи -
теля), т. е. специалисты, отвечающие за постановку целей и задач,
укрупненное планирование деятельности организации и оценку
выполнения этих планов.
2. Менеджеры, ответственные за разработку детальных планов
достижения целей, поставленных высшим руководством (Strategic level -
стратегический уровень): распределение работ по конкретным исполнителям, планирование использования ресурсов, контроль за выполнением планов и подготовкой укрупненных отчетов для высшего руководства.
3. Специалисты на местах, ответственные за выполнение определенных работ в соответствии с графиком (Desktop level — уровень операции) предоставление отчетов о состоянии выполняемых работ, их качестве, доступности, загрузке ресурсов и т. д.
Требования, выдвигаемые на уровнях высшего руководства и операций, применимы абсолютно к любой автоматизированной системе для управления предприятием. Действия специалистов, занимающихся детальным планированием (в данном случае — стратегический уровень), зависят от предметной области, в которой они работают. Среди сотрудников, работающих на уровне детального планирования проекта, можно выделить специалистов, ответственных за планирование сложных комплексных проектов (групп проектов и подпроектов в рамках этих групп). Для них работа по планированию проекта является основной обязанностью, и они имеют профессиональное образование в сфере управления проектами. Эти специалисты в большей мере определяют требования к мощности и гибкости ПО модуля управления проектами.
При реализации несложных проектов (или в небольших организациях) уровень детального планирования могут вести руководители предприятий, для которых планирование проектов не является основной работой, например директор небольшой фирмы или заместитель руководителя крупной организации (уровень высшего руководства), планирующий текущую деятельность своего предприятия, или начальники отделов (уровень операций), планирующие загрузку своих сотрудников. Для этой группы управленцев более важны такие характеристики системы, как простота использования и легкость обучения работы с ПО.
Пакеты управления проектами предназначены для планирования проектов и контроля за их выполнением на базе компьютерной технологии.
С их помощью можно: рассчитать варианты планов всех уровней детальности и выбрать наилучшие из них, оптимизировать использование ресурсов, определять резервы работ, формировать графики потребности в ресурсах и финансировании, вести наглядное отслеживание текущего состояния проекта в соотношении с плановым, выполнять стоимостной анализ хода работ, прогнозировать результаты имеющихся отклонений от плана, анализировать варианты корректировок планов и др.
Важной функцией пакетов управления проектами является определение резервов времени выполнения операций, знание которых необходимо для принятия решения о необходимости корректировки плана работ.
Системы управления проектами должны иметь следующие структурные элементы:
1. Средства для календарно-сетевого планирования (КСП);
2. Средства для решения частных задач (предпроектный анализ, разработка бюджетов, анализ рисков, управление контрактами, временем нем и т. д.);
3. Средства для упрощенного доступа к проектным данным;
4. Средства для организации коммуникаций;
5. Средства для интеграции с другими приложениями.
Системы для календарно-сетевого планирования (КСП) обеспечивают базовый набор функций, необходимый для проектирования структуры работ проекта (группы проектов), ресурсного планирования, обмена информацией между участниками проекта и контроля за его выполнением.
По функциональным возможностям все КСП-системы можно разделить на две категории: для постоянного использования системы профессиональными менеджерами проектов и для разового планирования проекта.
Это деление весьма условно. Мощность даже «непрофессиональных» КСП-систем позволяет строить расписания, состоящие из десятков тысяч работ, моделировать группы проектов, планировать неограниченное количество ресурсов, да и вообще использовать практически все функции, необходимые для успешного управления проектом.
Функциональные возможности систем для календарно-сетевого планирования показаны в таблице.
Для описания структуры работ | Описание логической структуры работ проекта в различных разрезах: сетевые диаграммы, кодировка по этапам, подразделениям, ответственным исполнителям и т. д. Планирование по методу критического пути. Определение временных параметров проекта. Моделирование расписания проекта с учетом различных временных ограничений |
Для ресурсного планирования | Описание структуры ресурсов и их доступности (календари ресурсов). Назначение ресурсов работам. Функции моделирования поведения проекта при различных ограничениях на использование ресурсов, проведение стоимостного анализа |
Для анализа рисков | Определение рисков в оценке длительности как отдельных работ, так и всего проекта. Расчет вероятности завершения проекта в установленные сроки |
Для обмена информацией | Публикация проектной информации на Intranet/internet-сервере. Обновление данных проекта с использованием удаленного доступа или электронной почты. Возможность обмена информацией с любыми другими приложениями |
Для контроля за ходом выполнения проекта | Фиксирование плановых показателей проекта. Ввод текущей информации о состоянии выполнения работ, загрузке ресурсов, расходах и т. д. Сравнение плановых показателей с фактическими. Моделирование хода предстоящих работ |
Для наглядного представления информации | Создание всех необходимых отчетов. Наглядное представление информации о проекте в виде различных диаграмм и графиков: календарный график выполнения работ (диаграмма Гантта), сетевая диаграмма проекта, гистограммы загрузки ресурсов и т. д. |
Профессиональные, так называемые high-end КСП-системы используются тогда, когда речь идет о больших проектах, о гибком ресурсном планировании, детальном анализе рисков и т. д.
Из средств для календарно-сетевого планирования можно выделить две группы продуктов: пакеты для составления расписаний и комплексные системы.
Пакеты для составления расписаний (Project Schedulers) в первую очередь ориентированы на разовое (случайное) планирование. Они позволяют задавать взаимосвязи между работами, строить диаграммы Гантта и сетевые диаграммы, рассчитывать критический путь, упрощенно оценивать загрузку ресурсов, стоимость проекта и т. д.
Комплексные системы предназначены для создания среды управления многочисленными сложными проектами (multi-project environ-ment). Они включают в себя не только высокопрофессиональные Инструменты для планирования, анализа и контроля над выполнением проектов, но и все необходимые средства для организации эффективных коммуникаций между участниками проектных команд и интеграции с комплексными ИС.
Провести четкую границу между остальными системами, куда попадают и программы начального уровня, в которых упор сделан на легкость применения, и профессиональные системы с расширенной функциональностью, достаточно трудно. Большинство из них содержит средства для интеграции с другими приложениями и организации эффективных коммуникаций в проектной команде; обмен информацией по электронной почте, удаленный доступ через веб-браузер с возможностью обновления данных, мастера для создания веб-отчетов и т. д.
Литература
1. Информационные технологии управления. Учебное пособие. Кн.3. Системы управления организацией. Меняев М.Ф. . – М.: Омега-Л, 2003.
2. Информатика. Учебник. Под ред. Н.В. Макаровой. – М.: Финансы и статистика, 2002.
3. Баронов В.В. и др. Автоматизация управления предприятием. – М.: ИНФРА-М, 2000. 239с.
4. http://www.gerhardt.com.ua