Общие сведения о программах, лексемах и алфавите
Тема 2. Лексические основы языка программирования
В тексте на любом естественном языке можно выделить четыре основные структурные компоненты: символы, слова, словосочетания и предложения. Подобные элементы содержит и любой алгоритмический язык: символы, лексемы, выражения и операторы. Лексемы образуются из символов, выражения из лексем, а операторы из выражений и лексем. Объединенная единым алгоритмом совокупность операторов образует программу на алгоритмическом языке.
Алфавит языка (или его символы) – это основные неделимые знаки, с помощью которых пишутся все тексты на языке.
В алфавит языка С++ входят
- арабские цифры
- латинские буквы и знак подчеркивания
- специальные знаки: “ ‘ {} . , & ? () [] < > и т.д.
- пробельные символы (пробел, табуляция, символ перехода на новую строку)
Лексемы(или элементарные конструкции) – минимальная конструкция языка, имеющая самостоятельный смысл.
Из символов алфавита формируются следующие лексемы языка:
- идентификаторы;
- ключевые слова (служебные, зарезервированные);
- знаки операций;
- константы;
- разделители (скобки, точка, запятая, пробельные символы).
Границы лексем определяются другими лексемами, такими как разделители, знаки операций и комментариями.
Рассмотрим каждый из видов лексем подробно.
Идентификатор – это набор символов, представляющих имя программного объекта. Правила написания идентификаторов в конкретном языке программирования указываются в справочниках по этому языку. Например в С++ идентификатор представляет собой последовательность из букв латинского алфавита, десятичных цифр и символов подчеркивания, начинающуюся не с цифры, причем прописные и строчные буквы различаются. На длину различаемой части идентификатора в С++ различные реализации накладывают свои ограничения (по стандарту длина не ограничена). Задание для самостоятельной работы: в справочной системе MS Visual Studio найти каковы ограничения на длину идентификатора.
Ключевые слова – это идентификаторы, зарезервированные в языке для специального использования. Ключевые слова языка также перечисляются в справочнике по языку, но знакомится с ними имеет смысл по мере изучения конструкций языка программирования.
Пример ключевых слов в языке С++:
int – ключевое слово для описания переменных целого типа
if– ключевое слово для построения условной конструкции
Знаки операций- это один или более символов, определяющих действия над операндами. Знаки операций обеспечивают формирование и последующие вычисление выражений. Выражение задает правило для получения значения. Один и тот же знак операции может употребляться в различных выражениях и по-разному интерпретироваться в зависимости от контекста. (Например, унарный и бинарный минус). Для каждой операции задан тип операндов, над которыми может выполняться данная операция. Операндами могут быть выражения и их частные случаи – константы и переменные. Операции делятся на унарные, бинарные и тернарую по количеству операндов (1,2,3 соответственно).
Примеры унарных операций
-7 унарный минус
a++ или ++a – операция инкремента (увеличения на единицу)
a-- или --a – операция декремента (уменьшения на единицу)
! a – операция отрицание
Все бинарные операции делятся на следующие основные группы:
- аддитивные (+,-);
- мультипликативные(*, /, %);
- поразрядные (&,|, ^);
- операции отношений (<, >, <=, >=, ==, !=);
- логические (&&, ||);
- присваивания (=, *=, );
- и др.
Рассмотрим тернарную условную операцию.
выражение1? выражение2: выражение3;
Если истинно выржение1, то выполняется выражение2, иначе выполняется выражение3
Например, a>0?b=1:b=-1
Все операции разделены на группы по приоритетам. Если в выражении встречаются операции с разными приоритетами, то сначала выполняются те, у которых приоритет выше. Если все операции имеют одинаковый приоритет, то они выполняются в соответствии с правилом ассоциативности либо слева направо, либо справа налево. Например,
a==++b*c+d (++ * + ==)
-!a (-(!a))
Для изменения порядка выполнения операций используются круглые скобки.
Задание для самостоятельной работы: Изучить операции языка С (см. пособие) и их приоритеты.
Константа –это лексема, представляющая изображение фиксированного числового (целого или вещественного), строкового или символьного значения.
Например,
целые 10, 012(8), 0хА(16);
вещественная 78.8, 5., .09, 0.2E-3;
символьная – один символ, заключенный в кавычки, например ‘a’, ‘\n’;
строковая - последовательность символов, заключенная в кавычки “Hello, World”.
Последовательность символов, начинающаяся с обратной косой черты называется escape-последовательностями (управляющими) и используются для представления
- кодов, не имеющих графического изображения;
- символов “ ‘ \ ?
- любого символа, с помощью его шестнадцатеричного и восьмеричного кода \141 \х61 =a (от 0 до 255).
Оператор задает законченное описание некоторого действия. (Существует путаница понятий, например, у Страуструпа оператор и операция – синонимы а для таких элементов языка, как if, for используются выражение statement – утверждение, предложение, инструкция). Каждый оператор в С++ заканчивается точкой с запятой.
Для описания сложного действия требуется последовательность операторов. Операторы могут быть объединены в составной оператор или блок с помощью инструктивных скобок (например, в С++ инструктивными являются скобки {}). В этом случае они рассматриваются как один оператор.
Операторы бывают исполняемые и не исполняемые. Исполняемые операторы задают действия над данными. Неисполняемые операторы служат для описания данных, поэтому их называют операторами описания или просто описаниями.
Правила построения элементов языка определяет синтаксис языка, а их смысл и правила использования определяет семантика, и, следовательно, нарушение формы записи элементов языка приводит к синтаксическим ошибкам, а правильно написанный, но не отвечающий алгоритму оператор приводит к семантическим ошибкам (логическим, ошибками времени выполнения).