Основні формати текстових файлів і їх перетворення.

Системи опрацювання текстів, їх класифікація та функції.

Однією з найпоширеніших функцій сучасного персонального комп'ютера є підготовка різноманітних текстових документів.

Розрізняють три групи програм підготовки текстових документів: текстові редактори, текстові процесори та видавничі системи.

Текстовими редакторами, в основному, називають програми, що створюють текстові файли без елементів форматування (тобто не дозволяють виділяти частини тексту різними шрифтами й гарнітурами).

Редактори такого роду незамінні під час створення текстів комп'ютер них програм.

Редактори неформатованих текстів:

NotePad - убудований в операційну систему Windows, зрозумілий і простий у використанні;

McEdit - подібний до редактора Edit із MS DOS, компонента файлового менеджера mc (Midnight Commander) ОС Linux;

KEdit - найпростіший текстовий редактор, який входить до складу KDE Linux;

KWrite - текстовий редактор, який має низку додаткових настроювань у порівнянні з іншими найпростішими текстовими редакторами;

Emacs - сполучає в собі функції файлового менеджера й тек стового редактора.

Текстові процесори вміють форматувати текст, вставляти в документ графіку й інші об'єкти, що не належать до класичного поняття «текст». Слід зазначити умовність такого поділу — розмаїтість програм для опрацювання тексту дозволяє знайти редактор із будь-яким набором функцій.

Редактори, що створюють текст із елементами розмітки:

Word — служить для створення різноманітних друкованих документів, є компонентом офісних додатків у MS Windows;

StarWriter — входить до складу програми StarOffice, зовнішнім виглядом і функціональністю схожий на Word, однаково добре працює як в MS Windows, так і в ОС Linux;

Ly (KLyeKDE) — сучасний текстовий редактор, призначений для людей, які хочуть одержати документ, що виглядає професійно, але витратити на його створення мінімум часу, редактор вставляє в текст команди розмітки Тех і LaTex; Netscape Com pose) - вставляє в текст команди розмітки мови HTML, існують версії як для ОС Linux так і для MS Windows.

Деякі текстові процесори є так званими WYSIWYG-редакторами. Назва отримана за першими буквами фрази What You See Is What You Get - «те, що ти бачиш, є те, що ти одержиш». Коли говорять, що це WYSIWYG-редактор, то гарантують повну відповідність зовнішнього вигляду документа на екрані комп'ютера і його друкованої копії. До редакторів такого типу належать Word i StarWriter.

Деякі сучасні редактори підтримують концепцію «майже» WYSIWYG. Вигляд документа на екрані при цьому дещо відрізняється від того, як буде виглядати надрукований документ, але робиться це спеціально з метою більш ефективного використання робочого вікна документа. Прикладами «майже» WYSIWYG-редакторів є Netscape Composer і KLy.

Видавничі системи дозволяють об'єднати текст, графіку й художнє оформлення для відтворення документів такого рівня, який раніше забезпечувала лише поліграфія. За допомогою цієї системи можна створювати книги, каталоги, буклети тощо на високому технічному рівні. Межа між вищим рівнем текстових процесорів і нижчим рівнем видавничих систем поступово стирається.

Текстові файли — найпоширеніший тип даних у комп'ютерному світі. Текстовий файл є формою подання послідовності символів у комп'ютері. Кожний символ із використовуваного набора символів кодується у вигляді одного байта, а решта у вигляді послідовності, двох, трьох і т. д. байтів, що ідуть підряд. Існують кілька проблем, пов'язаних з текстовими файлами. Перша — надзвичайно велика кількість символів, які вимагаються для підтримки різних мов. Американські програмісти для роботи з 128 символами використовують набір символів US ASCII (американський стандартний код для обміну інформацією). Для підтримки інших мов найчастіше не вистачає й 256 символів, тому зараз здійснюється поступовий перехід до кодування Unicode, у якому для зберігання одного символу приділяється вже два байти (тобто є можливість закодувати 65 536 різних символів).

Чимало текстових файлів передаються у вигляді простого тексту (plain text). Простий текст складно зробити привабливим і читати легко, оскільки в ньому немає шрифтів різних накреслень, графіків, заголовків, підзаголовків і т. д. Ці додаткові особливості звуться розмітки тексту (markup).

Файли, створені різними редакторами, найчастіше мають унікальні розширення, що дозволяють, не заглядаючи усередину документа, здогадатися про способи розмітки тексту. Так, файли, створені редакторами підготовки plain - тексту, часто мають розширення .txt, а підготовлені в редакторі Lyx — .lух.

Текстовий процесор Word за замовчуванням створює файли у форматі MS Word (розширення .doc), але підтримує й інші формати, наприклад RTF (роз ширення .rtf).

Документи, що містять команди розмітки мови HTML, мають розширення html або .htm.

Текстові файли часто використовуються для подання даних, які самі не є чисто текстовими. У цьому випадку інші формати файлів «надбудовуються» над простим текстом.

Мови програмування майже виключно використовують простий текст як основу. Зокрема, це дозволяє використати для опрацювання текстів програм різноманітні стандартні утиліти.

Файли конфігурації багатьох програм використовують текстовий формат, навіть якщо там зберігаються числа й двійкові перемикачі (так/ні). Хоча це викликає невеличке ускладнення програм через необхідність перетворення бінарних даних у текст і навпаки, проте набагато спрощується налагодження. Крім того, у разі необхідності можна підправити конфігурацію «вручну», без використання власних засобів настроювання даної програми.