Программы для работы с FTP-архивами
Программы для просмотра FTP
Регистрация пользователей в FTP
FTP - архивы обычно являются коммерческими, предназначенными для обслуживания зарегистрированных пользователей. Но каждый из них имеет открытую часть, содержащую freeware и shareware - ресурсы. Для регистрации в открытой части FTP - архива
1. 1. пользователь набирает имя "anonymous". Программа, обслуживающая таких пользователей, называется "анонимным FTP-сервером".
2. 2. после регистрации анонимный сервер запрашивает пароль. На этот запрос необходимо сообщить свой адрес электронной почты. Иногда в качестве пароля используется слово "guest".
FTP - архив имеет, иерархическую структуру: файлы расположены в директориях, которые могут являться поддиректориями директорий вышестоящего уровня. Для просмотра информационного наполнения FTP - архива необходима специальная программа "FTP - клиент". Наиболее известной программой - клиентом FTP является "cutftp", но в браузерах Internet Explorer и Netckape Navigator версий выше 3.0 встроены свои FTP - клиенты. Поэтому, для навигации по FTP - архиву из Internet Explorer, например, достаточно набрать в строке URL адрес FTP -сервера. Адрес FTP - сервера желательно набирать с указанием протокола, например: ftp://ftp.funnet.fi, ftp://ftp.svmbol.ru.
Многие FTP - серверы содержат в своей структуре специальный каталог /pub, содержащий файлы для свободного копирования. Кроме того, в каждый каталог включаются файлы "readme" или (и) "index", в которых находятся список и описание назначения файлов, собранных в данном каталоге.
Поиск файлов в ftp можно вести по адресу: http://www.filesearch.ru/
Обслуживание запросов на анонимном FTP - сервере ведет программа - робот, которая управляется командами FTP. При обращении к такому серверу по электронной почте необходимо в тексте письма указывать команды, на которые реагирует почтовый робот. К числу таких команд относятся: cd; dir; ascii - команда, предупреждающая робот, что запрашиваемый файл - текстовый; binary - команда, предупреждающая робот, что запрашиваемый файл - двоичный (т.е. программа, рисунок, аудиофайл, архивный файл, и т. д.); get имя - команда копирования файла "имя" из текущего каталога; quit.
1. Для облегчения поиска информации в сервисе FTP разработана программа Archie, ведущая поиск по централизованно составленным спискам - указателям файлов, доступных на анонимных FTP - серверах. База данных Archie включает указатели на несколько миллионов файлов, расположенных более чем на тысяче анонимных серверах. Для снижения нагрузки на серверы Archie, которые ежедневно обрабатывают десятки тысяч запросов, система Archie располагается на нескольких дублирующих друг друга серверах (зеркальных серверах - mirrors).
2. Кроме Archie ориентироваться в информационных ресурсах Internet помогают иерархические каталоги текстов и двоичных файловGopher.
Gopher - это ориентированная на меню система, позволяющая пользователям просматривать ресурсы Internet путем передвижения по цепочке тех меню, которые создаются администратором сервера Gopher. В Internet много серверов Gopher, найти в них нужные сведения сложно из-за большого количества информации. Для облегчения поиска в Gopher - пространстве разработана поисковая система Veronica, ведущая поиск по всему Gopher - пространству (по заданному поисковому образу Veronica производит поиск во всех известных ей меню Gopher). Результаты поиска оформляются в виде нового меню, работающего так же, как и меню Gopher.
вверх
В 1979г. была реализована идея аспирантов из университетов Дюка и Каролины, искавших возможность обмена информацией между компьютерами своих учебных заведений. Первоначально для такого обмена использовался протокол UUCP (Unix to Unix Copy Protocol). С 1986г. введен новый специальный протокол обмена новостями NNTP (Network News Transfer Protocol), совместимый с TCP/IP. Такая система распределенных по темам сообщений стала основой телеконференций Internet, ведущее положение среди которых занимают телеконференции Usenet. В Internet действуют и другие телеконференции. Система Usenet насчитывает более 10000 дискуссионных групп. Эти телеконференции обеспечивают обмен мнениями на международном уровне.
Телеконференции делятся на два вида: свободные и управляемые модератором Модератор получает все поступающие сообщения и определяет, соответствует ли тематике телеконференции поступившее сообщение, не нарушает ли оно сложившихся традиций данной конференции.
По тематике все телеконференции образуют иерархическую структуру. Верхний уровень этой иерархии образуют следующие рубрики:
п/п | Рубрика | Содержание рубрики |
alt | Альтернативные группы новостей | |
bit | Список рассылки Bitnet LISTSERV | |
biz | Реклама для бизнеса | |
Clarinet | Служба новостей (только по подписке) | |
comp | Все темы, связанные с компьютерами, с делением на группы – от новичков до профессионалов | |
K12 | Образование (дошкольное и школьное) | |
misc | Темы, не относящиеся ни к одной другой группе | |
news | Информация и новости, связанные с Usenet | |
Rec | Досуг и хобби | |
Sci | Различные темы из области научных исследований | |
soc | Социальная тематика, культура | |
talk | Обсуждение спорных вопросов (множество дискуссий по_различной тематике) |
Internet позволяет не только получать разнообразную информацию и обмениваться сообщениями, но и общаться в реальном масштабе времени с любым пользователем сети, где бы он не находился. Данная услуга называется IRC (Internet Relay Chat - Беседа через Интернет).
Фирма Microsoft выпустила freeware - программу для общения в реальном времени - NetMeeting. Кроме обмена информацией через Internets реальном масштабе времени с использованием набираемых на клавиатуре письменных сообщений, эта программа позволяет совместно использовать файлы. NetMeeting совместим с более чем 20 программными продуктами различных фирм для проведения конференций. Получить NetMeeting можно с Web-сайта фирмы Microsoft: http://www.microsoft.com/ie/conf/.
вверх
С точки зрения потребителя вся информация в Internet может быть разделена на телекоммуникационные информационные рынки электронной информации, электронных сделок, электронных услуг, сетевых коммуникаций и рынок программного обеспечения. Для поиска информации в Internet существуют информационно-поисковые системы (ИПС) трех типов: классификационные, словарные и предметные.
Классификационные ИПС используют иерархическую организацию информации, которая описывается с помощью классификатора. Разделы классификатора называются рубриками. В библиотечном деле для этой цели используется, например, систематический каталог. Классификатор разрабатывается и совершенствуется коллективом авторов. Затем его использует другой коллектив специалистов, называемых систематизаторами, которые, зная классификатор, читают документы и приписывают им классификационные индексы, указывающие, каким разделам классификатора эти документы соответствуют. В качестве примера классификационной ИПС в Internet можно назвать Yahoo! (www.yahoo.com), в которой одновременно работает более 100 систематизаторов, Excite, Look Smart, Yellow Web, "Созвездие Интернет", "Ay".
Классификационные ИПС обладают рядом специфических недостатков. Разработка классификатора связана с оценкой относительной важности различных областей человеческой деятельности. Любая оценка является социальным действием – она связана с обществом, культурой, социальной группой, к которой принадлежит производящий оценку человек. Поэтому классификаторы созданные разными коллективами в разных странах сильно различаются.
Кроме того, у систематизаторов возникают сложности с интерпретацией материалов, написанных на иностранных языках (не только исходных документов, но и классификаторов). Поскольку абсолютно строгой классификации не удается сделать никому, всегда существуют документы, которые можно отнести к нескольким разделам классификатора.
Систематизаторы в сложных случаях (когда неясно, к какому из разделов должен быть отнесен документ) применяют два приема:
- Отсылка (в Yahoo! она обозначается знаком @) помещается в тех разделах классификатора, в которые не попал данный документ - в ней указывается, к какой рубрике он отнесен систематизатором.
- Ссылка используется в тех случаях, когда аналогичная информация может находиться в других разделах классификатора.
Словарные ИПС используют базу данных, построенную из слов встречающихся в документах Internet* а. В такой базе при каждом слове хранится список документов, из которых оно взято. Поскольку все морфологические единицы в словаре упорядочены, поиск нужного слова может выполняться достаточно быстро, без последовательного просмотра. По одному слову найти требуемую информацию довольно сложно Поэтому, каждая словарная ИПС имеет свой язык запросов позволяющий комбинировать слова, наиболее полно характеризующие искомую информацию. К словарным ИПС Internet'а относятся такие, как Alta Vista, Rambler, Яндекс, Апорт.
Словарные ИПС способны выдавать списки документов, содержащие миллионы ссылок. Даже простой просмотр таких списков затруднителен. Поэтому многие словарные ИПС предоставляют возможность ранжирования результатов поиска - наиболее важные документы помещаются в начало списка. В языке запросов таких ИПС предусмотрены специальные средства, например, в режиме сложного поиска в Aha Vista можно указать перечень терминов, которые повышают ранг найденного документа (что для этой ИПС особенно актуально, так как она показывает только первые 200 найденных документов). Rambler и Яндекс позволяют указать вес каждого из терминов, что позволяет довольно точно настраивать порядок следования найденных документов.
В предметных ИПС с поисковым образом связаны списки ресурсов Сети, содержащих нужную информацию и ссылки на близкие по тематике сайты. В таких ИПС создаются кольцевые ссылочные структуры. Так, сервер www.webring.org содержит несколько десятков тысяч тематических колец (средний размер кольца - около 12 серверов, но есть и кольца-гиганты, в состав которых входят тысячи серверов). Пока кольца были небольшими, поиск информации трудностей не представлял. Для облегчения поиска на указанном сервере используются свои классификационная и словарная ИПС, помогающие найти необходимую информацию. С помощью информационно-поисковых систем можно искать вполне определенные информационные объекты, список которых включает:
- Термины
- Данные
- Библиографию
- Адреса
- Материалы конференций
У каждой поисковой системы существует свой язык запросов, который определяет правила, в соответствии с которыми формулируются запросы на поиск информации. В классификационных и словарных ИПС запрос составляется на основе ключевых слов, которые являются наиболее яркой характеристикой искомой информации (по сути, без этих слов данная информация обойтись не может). Лучше, если эти ключевые слова имеют специфический смысл, присущий только искомому информационному материалу, отличающему данный материал от всех остальных. На основе введенной пользователем поисковой строки в БД отыскивается предмет запроса и выводится список соответствующих ссылок. Число документов, полученных в результате поиска по запросу, может быть огромно. Однако, благодаря ранжированию документов, применяемому в большинстве поисковых машин, на первых страницах списка практически все документы окажутся релевантными (в идеале).
Основные принципы определения релевантности следующие:
1. Количество слов запроса в текстовом содержимом документа (в html-коде).
2. Тэги, в которых эти слова располагаются.
3. Местоположение искомых слов в документе.
4. Удельный вес слов (густота), относительно которых определяется релевантность, в общем количестве слов документа.
Эти принципы применяются всеми поисковыми системами.
Синтаксические правила и требования к построению запросов
Использование операторов булевой алгебры AND, OR, NOT: - AND (И) – осуществляется поиск документов, содержащих все термины, соединенные данным оператором; - OR (ИЛИ) - искомый текст должен содержать хотя бы один из терминов, соединенных данным оператором; - NOT (HE) - поиск документов, в тексте которых отсутствуют термины, следующие за данным оператором. |
Операторы расстояния - ограничивают порядок следования и расстояния между словами, например: - NEAR - второй термин должен находиться на расстоянии от первого, не превышающем определенного числа слов; - FOLLOWED BY - термины следуют в заданном порядке; - ADJ - термины, соединенные оператором, являются смежными. |
Возможность усечения терминов - использование символа " * " вместо окончания термина позволяет включить в искомый список все слова, производные от его начальной части (шаблона). |
Учет морфологии языка - машина автоматически учитывает все формы данного термина, возможные в языке, на котором ведется поиск. |
Возможность поиска по словосочетанию, фразе. |
Ограничение поиска элементом документа (слова запроса должны находиться именно в заголовке, первом абзаце, ссылках и т.д.). |
Ограничения по дате опубликования документа. |
Ограничения на количество совпадении терминов. |
Возможность поиска графических изображений. |
Чувствительность к строчным и прописным буквам. |
Существуют особенности показа полученного списка - некоторые поисковики показывают только ссылки; другие выводят ссылки с первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ссылкой.
Результат запроса (список ссылок) обрабатывается в два этапа. На первом этапе (автоматическая обработка) производится отсечение очевидно нерелевантных источников, попавших в выборку в силу несовершенства поисковой машины или недостаточной "интеллектуальности" запроса. Дальнейшая (ручная) обработка производится пользователем путем последовательного обращения на каждый из найденных ресурсов и анализа находящейся там информации. Когда пользователь щелкает на ссылку из списка, то перед запросом соответствующего документа у того сервера, на котором он находится, поисковики заносят в свою БД отметку о пользовательском предпочтении. Собранная информация о поведении пользователей (формулировки запросов и выбранные из списка ресурсы) успешно используется в рекламных компаниях в Сети.
вверх
Появление WWW изменило ситуацию, создав возможность разработки и использования в Internet мультимедийных узлов, использующих текст, изображение, звук в режиме реального времени. Для работы с изображением и звуком возможностей браузера может оказаться недостаточно, нужны будут дополнительные программы. Встраивание их в браузер заключается в инсталляции программ и указании, какому типу файлов эти программы необходимы.
Для просмотра графики Internet Explorer имеет встроенные средства показа изображений в форматах GIF и JPEG.
Для просмотра анимации встроены возможности показа файлов формата AVI.
Для проигрывания звука встроены возможности для форматов WAV, MID, AU, SND, ABF, AIFF.
Если встречается незнакомый формат, Internet Explorer просит указать, с какой программой надо связать данный тип файла.
Используя под WWW такие программы, как Microsoft NetMeeting, можно проводить видеоконференции и междугородние переговоры (цены на которые значительно ниже, чем при использовании телефонной связи).
Мультимедиа - технологии позволяют использовать компьютер для приема радиопередач: National Public Radio (NPR), Internet Talk Radio (ITR), Realaudio ведут регулярные радиопередачи в Internet.
Правда, из-за низкой скорости модема, прослушать их можно часто лишь в записи. Для этого Internet - радиостанции записывают свои радиопередачи в файлах с различными аудиоформатами. Получить эти файлы для дальнейшего прослушивания можно через сервис FTP.
В последнее время активно развивается новое направление, расширяющее возможности мультимедиа - это VRML (Virtual Reality Modelling Language - язык моделирования виртуальной реальности).
Гипертекстовые ссылки HTML и использующие их Web-браузеры позволяют создать лишь двухмерный интерфейс к содержащейся в Internet информации. VRML расширяет эти возможности до трехмерных. Путешествие по миру VRML отличается от путешествия по обычной Web-странице: в Web-странице можно перемещаться только вперед или назад (может быть - вправо и влево). В VRML-среде можно ходить и летать, т.е. вводится третье измерение.
Работа в VRML-среде ведется с помощью VRML-браузера, который может быть выполнен в виде самостоятельного программного продукта или в виде добавления к HTML-браузеру. Так например, добавляемый модуль VRML для Internet Explorer можно получить по адресу: http://www.microsoft.com/ie/ .
Самостоятельный браузер VR Scout и подключаемый модуль Netscape Navigator, работающие под Windows, доступны через Web-сайт "Chaco Communications, Inc.": http://www.chaco.com/vrscout .
Один из первых VRML-браузеров для Windows - "Word View" можно получить по адресу: http://www.webmaster.com/vrm].
Установив VRML-браузер, можно познакомиться с VRML-мирами на примере мира "road.wri", который можно найти по адресу: http://found.cs.nyu.edu/dfox/road.wri . Особенно ярко новые возможности проявляются в режиме "fly" (полет).
вверх
Для организации диалога с посетителем сайта предназначены формы. Посетитель заносит требуемую информацию в форму, используя управляющие элементы(кнопки, поля ввода, поля ввода пароля, переключатели, радио-кнопки, списки, текстовые области,скрытые поля). После того, как пользователь заполнил форму он нажимает кнопку Submit которая говорит, что форму надо отправить на сервер. Браузер собирает все имена и значения элементов формы, кодирует их и в зависимости от указаного в тэге FORM метода вызывает GET или POST с указаным URL,передавая ему данные.
На сервере CGI-скрипту информация попадает (в зависимости от метода) либо в переменную QUERY_STRING либо на STDIN. Скрипт может проверить данные ,занести их в какую-нибудь базу данных, может как yahoo выполнить какой-нибудь поиск, может что-нибудь вычислить... В конце концов скрипт выдает браузеру ответ, который он и отображает.
Основные команды HTML для автоматизации страниц: