Многоязычный текстовый процессор accent

Введение
Практически каждый пользователь компьютера встречается с необходимостью подготовки тех или иных документов - писем, статей, служебных записок, отчетов и т.д. - на каком-либо иностранном языке. И почти каждому пользователю, если у него нет соответствующей программы-перехода или шрифта, не удается это сделать.
Первые текстовые редакторы разрабатывались в расчете на работу с английским языком, и набор разрешенных к использованию алфавитных символов ограничивался в них стандартной латиницей. Современные программы подготовки документов умеют справляться с неанглийским текстом, но из одноязычных они превратились всего-навсего в двуязычные: как правило, для каждой страны создается специальная адаптированная версия, обеспечивающая работу с соответствующим языком, а также с английским. Подключить еще один язык (чтобы, например, вставить в русский текст одну-две фразы по-немецки или по-голландски) в большинстве случаев возможно (если найдутся соответствующие шрифты), но не всегда просто.
Такое положение особенно неприятно для переводчиков, лингвистов, составителей деловой корреспонденции на другом языке и тех, чья работа в той или иной мере связана с обработкой иностранных текстов. Да и в самой нашей республике имеется проблема редакторов с якутским языком, иногда чтобы набрать текст на родном языке приходится переключаться то на английский, то на кириллицу, то писать все время вместо буквы 5 цифру 5, но эффект остается все равно низким.
В моем реферате речь пойдет о текстовом процессоре, который проектировался как многоязычный с самого начала.
1. История создания ACCENTа
Пакет называется ACCENT, по-русски - “АКЦЕНТ” (подразумевается не иностранный акцент, а надстрочный знак ударения); его производитель - израильская компания Accent Software, чьей первой разработкой была “двунаправленная” (bidirectional) версия Windows, в которой курсор может автоматически двигаться не только слева направо, но и справа налево - в соответствии с направлением письма в иврите и арабском. В дальнейшем компания стала специализироваться на программах подготовки многоязычных документов - продуктах LanguageWare.
В 1992 г. Accent Software выпустила текстовый процессор “Дагеш” (дагеш - примерно соответствующий акценту по начертанию и использованию знак еврейского письма) для “двунаправленной” Windows, поддерживающий четыре языка: иврит, арабский (государственные языки Израиля), английский и русский. А так как в определенном смысле все что больше двух, - это уже много, программа, манипулирующая четырьмя языками должна быть основана на технике, позволяющей работать с любым их числом. И в 1994г. выходит пакет Accent 1.0, обеспечивающий создание документа на трех с лишним десятках европейских языков (с вариантами по странам).
В марте 1995 г. появляется версия Accent 2.0, где набор языков еще расширен; в частности, добавлен иврит и арабский (для обычных не “двунаправленных” вариантов Windows проблему курсора потребовалось решить заново). В моем реферате речь пойдет о версии 1.1 (с которой я сам однажды работал), от ноября 1995г. (более модернизированной версии 1.0) и о версии 2.0, более профессиональной и громоздкой, на которой основаны все последующие пакеты Accent, и которая, как я думаю, более распространена среди российских переводчиков-пользователей.
2. Многоязычные документы
Итак, “Акцент” - текстовый процессор для Windows, который обеспечивает работу с многоязычными документами. Идея многоязычного документа проста и изящна: признак языка делается стилевым атрибутом символа - как бы еще одной шрифтовой характеристикой вроде кегля или способа выделения. Соответственно в зависимости от текущего языка перенастраиваются такие параметры обработки текста, как проверка правописания и расстановка переносов. Среди атрибутов имеется и цвет, так что текст можно “раскрасить” в зависимости от языка.
Все поддерживаемые языки обеспечены шрифтами True Type и раскладками клавиатуры, что крайне полезно при работе на неродном языке; если для какого-то языка существуют разные раскладки, “Акцент” это учитывает - в частности, предусмотрено несколько русских клавиатур. Дополнительные языково-зависимые функции редактирования (они созданы не в самой Accent Software, а являются лицензированными продуктами независимых разработчиков) реализованы пока лишь для части языков (см. таблицу); проверка правописания - для 17, расстановка переносов - для 13, словарь синонимов - для 9, многоязычный переводной словарь - для 5. Понятно, что расширение набора этих функций - проблема скорее организационная, чем техническая. Конечно, новые словари потребуют дополнительного дискового пространства, но ведь можно установить пакет и не целиком. Минимальная конфигурация “Акцента” занимает на диске 6 Мбайт, полная 22 Мбайт (для Accent 1.1).
Таблица. Языки Accent
Язык
Работа с текстом
Интерфейс

Проверка правописания
Расстановка переносов
Словарь синонимов
Меню
Встроенная документация
Печатная документация
албанский

английский (американский)
+
+
+
+
+
+
английский (британский)
+
+
+



арабский



*


белорусский






болгарский






венгерский

+

*


голландский
+
+
+
+
*

греческий



+


датский
+
+

*


иврит



*


исландский






испанский
+
+
+
+
+
+
испанский (латиноамериканский)
+





итальянский
+
+
+
+
+
+
каталонский






молдавский (латиница)






немецкий
+
+
+
+
+
+
немецкий (швейцарский)
+





норвежский
+
+
+



польский






португальский
+


+
+

португальский (бразильский)
+





румынский






русский
+
+

+
+

сербский






словацкий






словенский



+


турецкий



+


украинский






финский
+
+

+
+

фламандский






французский
+
+
+
+
+
+
французский (канадский)
+





хорватский



+


чешский



+


шведский
+
+
+
+



+ - имеется в Accent 1.1.
* - только в Accent 2.0.
Закрепление за каждым отрывком текста своего языка накладывает определенные ограничения; так, в “Акценте” не поддерживается поиск фрагментов, содержащих символы из алфавитов разных языков (наподобие постоянно встречающихся в русскоязычных компьютерных изданиях “Windows-программа”, “EXE-файл”, “OLE-объект” и т.п.) Тем самым за многоязычие приходится платить отказом от некоторых удобств, автоматически представляемых практически всеми “англо-русскими” редакторами; в таком положении оказываются все, кто пишет на языках с алфавитом на нелатинской основе.
Интересной основой “Акцента” является автоматическое переключение текущего набора атрибутов; если щелкнуть кнопкой мыши, когда I-образный указатель находится на каком-нибудь символе, атрибуты этого символа делаются текущими (позиция ввода оказывается слева или справа от символа в зависимости от того, на какой его половине стоял указатель). К автоматическому переключению необходимо приспособиться - тому, кто привык к другим текстовым процессорам для Windows , оно, возможно будет поначалу мешать; действительно пытаешься всего-навсего изменить позицию ввода, а впридачу меняются шрифт, раскладка клавиатуры и т.д. Но когда приходится часто переходить с языка на язык (или, скажем, с курсива на прямой шрифт и обратно), это позволяет сэкономить массу времени.
Также особой характеристикой Accent является встроенная программа-переводчик (профессиональная версия), который обеспечивает перевод около 20 языков. Нельзя сказать, что перевод безупречный по сравнению с другими программами (Stylus, Socrat и т.д.), но для непосредственного перевода некоторых незнакомых слов он незаменим.
3. Управление языком интерфейса
Многоязычным сделан и интерфейс “Акцента”; для выбора языка меню предусмотрена специальная кнопка с изображением глобуса, при переключении меню автоматически меняется и язык встроенной документации (если имеется соответствующий файл). Меню существуют на 15 языках (в Accent 2.0 к ним добавились еще 4), встроенная документация - на 8 (в Accent 2.0 - на 9). Русский среди них есть, так что в русификации “Акцент” не нуждается.
Очень удобно, что не нужно переключать режим клавиатуры, когда при работе с русским текстом требуется ввести имя файла: в поле имени автоматически вводится латиница. Правда, чтобы выбрать пункт русскоязычного меню по букве (+Ф - “Файл”, +Р - “Редактирование” и т.д.), придется-таки включить стандартный драйвер кириллицы (кстати, это единственное, для чего он может понадобиться в “Акценте”), и тогда имена вводиться перестанут.
Что касается русскоязычной документации, то ее качество, пожалуй, не хуже, чем у большинства русифицированных западных пакетов. И хотя некоторые термины отличаются от принятых в России - скажем, “унаследование” или “равномерный шрифт” вместо “наследование” и “моноширинный шрифт”, - это не слишком затрудняет понимание.
4. Другие характеристики
По сравнению с Word for Windows, например, “Акцент” попроще - нет встроенного Бейсика, функций редактирования графиков, формул и изображений, возможности оформления текста примерно такие же. Пакет предоставляет относительно бедные средства работы с таблицами, но в версии 2.0 положение исправлено. Есть шаблоны, печатать со слиянием (print merge - “совмещенная печать” в терминологии “Акцента”) и т.д. Вообще Accent является исключительно текстовым редактором, так что навороты, которые предоставляют другие редакторы практически исключены.
Сильной стороной рассматриваемого продукта является и то, что “Акцент” обеспечивает импорт и экспорт документов в форматах Lotus 1-2-3, WordStar, AmiPro, Excel 4 и 5 (их однако можно только читать), Word для DOS 3-6, Word for Windows 1-6, WordPerfect 5.1, WordPerfect for Windows, WordPerfect 4-6 для DOS, Write 3.0, а также ASCII-текстов (с разбивкой на строки и без) и RTF-текстов. И этот список далеко не полон, приведены только наиболее распространенные форматы. Предусмотрена вставка в документ изображений форматов BMP, TIFF, GIF, PCX, EPS и WMF.
Единственная сложность может возникнуть при работе со стилями. Необходимо будет определить и назвать стили в Accent так же, как они называются в том программном продукте, куда будет экспортироваться документ.
Конвертирование в форматы и из форматов DOS-программ учитывает соответствие национальных кодовых страниц для DOS и Windows (естественно, при экспорте многоязычного текста придется выбрать что-то одно).
Нельзя сказать, чтобы импорт и экспорт всегда проходили абсолютно гладко. К примеру, экспортировать в ASCII-формат русский текст удалось только для трех кириллических шрифтов, поставляемых с “Акцентом” - остальные (инсталлированные независимо) программа конвертировать отказалась. В экспериментах с Word for Windows бывало, что “ехали” таблицы, выключенный текст превращался в центрированный и т.д. (все это, разумеется, несложно поправить вручную). Надо заметить, что от мелких погрешностей такого рода не свободен ни один из существующих текстовых процессоров со сколько-нибудь развитыми функциями импорта и экспорта, а в случае “Акцента” задача сложнее - ведь необходимо обеспечить правильную работу этих функций сразу для всех национальных вариантов поддерживаемых форматов. Важным достоинством документации является то, что она честно предупреждает пользователя о возможных трудностях и советует, как их преодолеть.
“Акцент” можно использовать в сети - очень удобно для бюро переводов, издательства, выпускающего литературу на нескольких языках, или просто фирмы, имеющей партнеров в разных странах. При сохранении документа на диске его можно зашифровать, а также сжать; степень сжатия существенно зависит от доли нетекстовой информации (элементов шрифтовой разметки, иллюстраций), но чаще всего оказывается примерно вдвое ниже, чем при упаковке универсальным архиватором (ARJ, LHA, PKZIP).
5. О том, чего нет и что возможно будет
С точки зрения переводчиков-профессионалов, в “Акценте” есть, наверное, все, чего только можно желать. Но если выйти за рамки деловой переписки и технической документации, обнаружится, что некоторые вещи все же отсутствуют. Так, применительно к русскому языку “Акцент” не оправдывает своего названия - он не позволяет набрать акцентуированный русский текст (то есть текст, в котором проставлены ударения). В результате “Акцент” оказывается непригоден для подготовки такой важной разновидности многоязычных текстов, как учебники и общеязыковые словари. (Проблема, разумеется, не является “чисто русской” - специальные символы и значки используются в учебных текстах и словарях многих языков).
О необходимости диакритик (надстрочных и подстрочных знаков) для европейских алфавитов, по-видимому, просто забыли, - скорее всего, из-за того, что буквы с диакритиками имеются в стандартных шрифтах. Принципиальной же сложности, насколько можно судить со стороны, здесь нет - ведь “Акцент” позволяет огласовать арабский текст (в арабском гласные обозначаются диакритиками, причем это делается примерно в тех же разновидностях текстов, в каких по-русски проставляются ударения). Возможно, Accent Software добавит такую возможность в одной из следующих версий.
Практически полностью отсутствуют средства верстки, которые реализованы во многих программных продуктах начального уровня. Например, фрагмент текста, таблицу или графический объект нельзя забрать в кадр, обтекаемый основным текстом. Остается только размещать эти объекты во всю ширину листа, что ухудшает внешний вид документа и усложняет его читаемость. Впрочем, многие полагают, что при конторском или домашнем использовании текстовых процессоров эти функции обычно ненужны. К тому же их реализация требует значительного расхода ресурсов, что тормозит машину и чревато зависанием или аварийным завершением программы. Недостатком Accent является, пожалуй, и то, что иконки на кнопках очень далеки от интуитивной понятности.
Также хотелось бы чуть-чуть “приоткрыть” интерфейс программы - так, чтобы можно было добавить к списку языков новый язык и определить для него группу шрифтов и раскладку клавиатуры, то есть составить другой алфавит, используя буквы из разных. Хотя такие планы уже рассматриваются в Accent Software и, возможно, что Accent Software уже сейчас создал данный сервис. Это позволит пользователю формировать нестандартные наборы символов и работать с ними. Ведь у разработчиков, наверное, еще не очень скоро дойдут руки до таких языков, как якутский или абхазский (при том, что готовые шрифты для них уже существуют), а при данном сервисе пользователь без проблем составит свой алфавит.
В ближайших планах компании - подключение новых языков с принципиально иными системами письма: хинди, японского и двух вариантов китайского. И если хинди - все-таки язык с алфавитной письменностью (правда, гласные обозначаются диакритиками, а сочетания согласных сливаются в единые сложные знаки - лигатуры), то китайцы и японцы, как известно, пользуются иероглифами. Здесь разработчикам потребуется организовать работу с большими (из нескольких тысяч элементов) наборами символов, в частности реализовать ввод этих символов.
Объявлен и возможно осуществлен новый многоязычный проект Accent Software с кодовым названием Scotty. Его цель - создание почтовой утилиты, позволяющей посылать по сети Internet тексты на разных языках. Для пересылки предполагается использовать разработанный фирмой BitStream формат TrueDoc, в котором в сжатом виде представлен как собственно текст, так и информация о шрифтах.
Продукт будет состоять из двух частей - Reader и Writer - соответственно для чтения и написания корреспонденции. При этом Accent Software планирует распространять Reader бесплатно, а Writer встраивать в свои продукты и продавать лицензии на эту программу независимым разработчикам и организациям, предоставляющим сетевой сервис. И может быть скоро мы будем посылать в Америку письма на своем родном языке с помощью Accent-а, не заботясь о том, какая у получателя машина и операционная система.
6. Требуемые ресурсы и условия использования
Минимальная конфигурация компьютера, на которой будет работать Accent 1.1, - 286-й процессор или выше, 4 Мбайт оперативной памяти; 3,5 Мбайт свободного дискового пространства, видеосистема VGA или выше, Windows 3.1 или новее. Но для нормальной работы нужен все-таки быстрый 386SX, а лучше DX/33 или 40. На 386-й машине с 4 Мбайт памяти Accent трудится вполне приемлемо, особенно если в документе нет графических объектов. В этом случае скорость работы даже можно назвать комфортной. Тем более что у Accent гораздо меньше недостатков и неприятных особенностей, связанных с плохой отладкой, чем у продуктов с громкими именами. К тому же многие функции, использование которых здорово тормозит машину, в Accent не реализованы. Не следует устанавливать и поддержку большого количества языков, что может также сильно замедлять работу. Двух-трех будет вполне достаточно. В такой конфигурации Accent займет на диске 7-9 Мбайт. Но а полная конфигурация (с установкой инструментария для всех поддерживаемых языков и переводчика) составляет 37 Мбайт.
Текстовый процессор Accent - коммерческий продукт. Облегченная версия с поддержкой двух-трех языков стоит 70 долларов, а полная, куда входит автоматический переводчик и поддержка 50 языков, почти 400 долларов. Существуют и другие релизы стоимостью от 140 до 300 долларов. Рабочую демо-версию можно списать из Интернета, с сайта http://www.download. com или http://www.accentsoft.com. Кроме того, дистрибутив Accent можно встретить и на некоторых CD-дисках с бесплатными и условно бесплатными программами.
Заключение
Текстовый редактор, который я рассмотрел является многоязычным. Он несомненно будет нужен в будущем для студентов из отделения мировой экономики для составления деловой корреспонденции и подготовки документов на иностранных языках. Ведь международные отношения нашей республики все время расширяются, появляются новые страны-партнеры с более сложным алфавитом (Китай, Япония, Корея) и автоматически выходит на первый план проблема переписки. Рассмотренный мной процессор с его скоростью обновления как раз решает эту проблему.
С увеличением сети Интернет по всему миру появляется также проблема связи “читатель - пишущий” (мы не можем прочитать информацию на русском, посылаемую из России, например, во Франции) которую также решит Accent.
Также, возможно, он снимет задачу составления локальных алфавитов и языковых стилей непосредственно в любом месте. Действительно, очень непросто напечатать якутский текст на простом редакторе (проблема, которая также касается многих народов, особенно из бывшего СССР). Хотя, конечно, рядовой пользователь может составить якутский текст в другом редакторе, например, в известном “Лексиконе”, если загрузить соответствующий якутский шрифт (они очень редко, но встречаются на дискетах), или в том же Word-е, также если есть шрифт (font) - там вместо цифр 1, 2, 3, 4 соответственно якутские буквы -, то есть прослеживается чистая зависимость редакторов от якутских шрифтов, которые, по-моему, не очень распространены среди наших пользователей (в принципе, идея Accent-а основана на таких уже составленных иностранных шрифтах, но в отличие от Word-а здесь нет необходимости все время обновлять словарь, все уже готово), но именно Accent предоставит возможность составления шрифтов по желанию и в любом месте. Например, предположим, что пользователь находится в Москве или даже, для усложнения, в Китае и ему необходимо составить письмо на якутском языке, там не будет никаких русских, тем более якутских шрифтов и тут ему на помощь может прийти только Accent, в котором пять десятков языков (в будущем, дополненном Accent-е около 130)* и которыми можно располагать сколь угодно, то есть на основе русского, турецкого, греческого, кипрского алфавитов составить якутский и также составить раскладку клавиатуры. Соответственно, можно печатать на аджарском, чеченском, бурятском, башкирском и других языках, алфавит которых основан на каких-либо других алфавитах.
Почему я выбрал именно эту тему? Я думаю, что этот процессор будет, возможно, довольно сильно распространен не только среди переводчиков-профессионалов, но и среди простых пользователей. Ведь мир становится все плотнее и интегрированнее, следовательно простому человеку приходится изучать все больше языков (не говоря уже об английском), следовательно ему нужен один единый текстовый редактор, который мог бы “говорить” на многих языках и предоставить весь список услуг (перенос слов, проверку орфографии, синонимы и т.д.) для каждого отдельного языка, и как раз данным редактором, на данный момент, является Accent. И я надеюсь, что мой реферат хоть как-то приблизит Accent к нашим, якутским, пользователям.
Использованная литература:
1. Левин Г.Д. Современные текстовые редакторы. С.-Пб.: Ромб, 1996.
2. Кольц К., Робенсон Л. Программы-переводчики./ Пер. с англ.М.: Эврика, 1995.
3. Алексеева О.И. Редактор-лингвист // Домашний компьютер, 1996. №25.
4. Дыбо А.В. Многоязычный текстовый процессор // Мир ПК, 1996. №7-8.
5. Иргман Л.Е. Редактор Accent // Компьютерра, 4 марта. 1995. №12.
5. Коган М.Л. Долой языковые барьеры! //Домашний компьютер, 1995.№ 12.
6. Новинка: свой для всех.// Ровестник, 1996. №21.
7. Шпунт Я. Accent 2.0 // Компьютерра, 11 авг. 1997. №32.
8. http://www.accentsoft.com