Потоковый редактор sed

Формат командной строки:

sed [-n] сценарий [ файл ...]

sed [-n] [-e сценарий ]... [ -f файл_сценария ]... [ файл ...]

Sed — потоковый редактор считывающий строки из текстовых файлов или со стандартного ввода, изменяющий их, в зависимости от команд редактирования указанных в параметре сце­нарий или в файле файл_сценария и выводящий результат на стандартный вывод. Ключ -n подавляет вывод всех строк файла (производимый по умолчанию). Каждый сценарий (параметр сценарий) состоит из команд редактирования (по одной в строке) следующего вида:

[адрес![,адрес3]]команда[аргументы]

допускаются пробельные символы перед первым адресом и перед командой. В нормальном режиме sed циклически копирует входную строку в рабочую область (в случае, если там ничего не осталось от предыдущей команды), применяет к ней последовательно все команды сценария, чьи адресные выражения содержат данную строку, выводит результат на стандартный вывод (если не указан ключ -n) и очищает рабочую область. Некоторые команды используют область сохранения, чтобы запомнить всю рабочую область или ее часть для последующего использова­ния. Рабочая область и область сохранения способны хранить не менее 8192 байт. Адрес либо пустое поле, либо десятичное число, означающее номер входной строки, либо знак доллара ($ ), соответствующий последней строке, либо контекстный адрес (который состоит из регулярного выражения предваренного и заканчивающегося некоторым ограничителем, обычно косой чертой. Командная строка не содержащая адреса применяется к каждой строке. Командная строка со­держащая один адрес применяется к каждой строке соответствующей адресу. Командная строка содержащая два адреса применяется ко всем строкам начиная с соответствущей первому адре­су и заканчивая соответствующей второму. Начиная с первой строки, следующей за указанным диапазоном sed снова проверяет строки на соответствие первому адресу и, в случае нахождения соответствия, процесс повторяется.

Команды могут применяться к строкам не входящим в диапазон при помощи команды отри­цания !.

Sed поддерживает базовые регулярные выражения со следующими дополнениями:

• В контекстных адресах, конструкция cREc, где c любой символ, отличный от обратной косой черты и символа новой строки, идентична /RE/.

Последовательность \n соответствует символу новой строки.

В следующем списке команд, максимальное число адресов для команды определено после­довательностями [0addr], [1addr] и [2addr]. Аргумент text состоит из одной или более строк. Каждый символ новой строки должен быть предварен обратной косой чертой. Прочие символы новой строки удаляются.

[2addr]command-list

Выполнять command-list, для указанных строк.

[1addr]a\text

Вывести текст перед обработкой указанной строки.

[2addr]b [метка]

Перейти к команде :, содержащей указанную метку. Если метка пуста, перейти в конец сценария.

[2addr ]c\text

Удалить рабочую область. При пустом или одном адресе или в конце двухадресного диапазона вывести текст.

[2addr]d

Удалить рабочую область.

[2addr]D

Удалить начало рабочей области, до первого перевода строки включительно.

[2addr]g

Заменить содержимое рабочей области содержимым области сохранения.

[2addr]G

Добавить к содержимому рабочей области символ новой строки с последующим содер­жимым области сохранения.

[2addr]h

Заменить содержимое области сохранения содержимым рабочей области.

[2addr]H

Добавить к содержимому области сохранения содержимое рабочей области.

[1addr]i\text

Вывести текст.

[2addr]l

Вывести содержимое рабочей области, заменяя символы табуляции, перевода строки, обратной косой черты и т.п. на пары символов \,\a ,\b ,\f ,\r ,\t ,\v. Прочие непечатные символы заменяются трехзначными восьмеричными числами предваренными обратной косой чертой.

[2addr]n

Вывести содержимое рабочей области на стандартный вывод и считать в рабочую об­ласть следующую входную строку.

[2addr]N

Добавить к содержимому рабочей области следующую входную строку. При этом из­меняется текущий номер строки.

[2addr]p

Вывести рабочую область на стандартный вывод.

[2addr]P

Вывести начало рабочей области, до первого символа новой строки на стандартный вывод.

[1addr]q

Перейти в конец сценария и выйти.

[2addr]r rfile

Скопировать содержимое файла rfile на стандартный вывод до обработки следующей входной строки.

[2addr]s/reg-exp/replacement/flags

Подставить replacement вместо подстрок рабочей области, соответствующих регулярно­му выражению reg-exp. Вместо косой черты можно использовать любой другой символ. Символ амперсенда & в replacement будет заменен строкой, соответствующей регуляр­ному выражению. Символы \n, где n цифра, будут заменены соответствующей обратной ссылкой. Могут использоваться следующие флаги:

n Заменять n-ое вхождение регулярного выражения.

g Заменить все вхождения регулярного выражения.

p Выводить содержимое рабочей области если произведена замена.

w wfile

Добавить содержимое рабочей области в файл wfile если произведена замена.

[2addr]t [label]

Перейти к команде :, содержащей метку label, если с момента последнего чтения входной строки или последнего выполнения команды t в буфере выполнялись подстановки. Если метка опущена, перейти в конец сценария.

[2addr]w wfile

Добавить содержимое рабочей области к файлу wfile.

[2addr]x

Обменять содержимое рабочей области и области сохранения.

[2addr]y/string1/string2/

Заменить все включения символов содержащихся в строке string1 соответствующими символами строки string2. Строка string1 не должна содержать повторяющиеся симво­лы, длины строк должны совпадать.

[2addr]!command

Применить команду только к тем строкам, которые не принадлежат указанным адресам.

[0addr]: label

Команда ничего не делает. Содержит метку, на которую можно перейти командами b и t.

[1addr]=

Выводит номер текущей строки.

[0addr]

Пустая команда.

[0addr]#

Символ # и остальные, до конца строки, игнорируются (комментарий).