Архитектура потоковых вычислительных систем
2.
Рис. 14.3. Движение маркеров при вычислении A / B + B ´ C: а – после подачи входных данных; б – после копирования; в – после умножения и деления; г – после суммирования
Практические вычисления требуют дополнительных возможностей, напри-мер при выполнении команд условного перехода. По этой причине в потоковых графах предусмотрены вершины-примитивы нескольких типов (рис. 14.4):
Рис. 14.4. Примитивы узлов: а – двухвходовая операционная вершина; б – одновходовая операционная вершина; в – вершина ветвления; г – вершина слияния; д – TF-коммутатор; е – T-коммутатор; ж – F-коммутатор; з – вентиль; и – арбитр
§ двухвходовая операционная вершина – узел с двумя входами и одним вы-ходом. Операции производятся над данными, поступающими с левой и правой входных дуг, а результат выводится через выходную дугу;
§ одновходовая операционная вершина – узел с одним входом и одним вы-ходом. Операции выполняются над входными данными, результат выво-дится через выходное ребро;
§ вершина ветвления – узел с одним входом и двумя выходами. Осуществляет копирование входных данных и их вывод через две выходные дуги. Путем комбинации таких узлов можно строить вершины ветвления на m выходов;
§ вершина слияния – узел с двумя входами и одним выходом. Данные по-ступают только с какого-нибудь одного из двух входов. Входные данные без изменения подаются на выход. Комбинируя такие узлы, можно стро- ить вершины слияния с m входами;
§ вершина управления – существует в перечисленных ниже трех вариантах:
ú TF-коммутатор – узел с двумя входами и одним выходом. Верхний вход – это дуга данных, а правый – дуга управления (логические дан-ные). Если значение правого входа истинно (T – True), то входные дан-ные выводятся через левый выход, а при ложном значении на правом входе (F – False) данные следуют через правый выход;
ú вентиль – узел с двумя входами и одним выходом. Верхний вход – дуга данных, а правый – дуга управления. При истинном значении на входе управления данные выводятся через выходную дугу;
ú арбитр – узел с двумя входами и двумя выходами. Все дуги являются дугами данных. Первые поступившие от двух входов данные следуют через левую дугу, а прибывшие впоследствии – через правую выходную дугу. Активация вершины происходит в момент прихода данных с какого-либо одного входа.
Процесс обработки может выполняться аналогично конвейерному режиму: после обработки первого набора входных сигналов на вход графа может быть подан второй и т.д. Отличие состоит в том, что промежуточные результаты (токены) первого вычисления не обрабатываются совместно с промежуточными результатами второго и последующих вычислений. Результаты обычно требуются в последовательности использования входов.
Существует множество случаев, когда определенные вычисления должны повторяться с различными данными, особенно в программных циклах. Про-граммные циклические процессы в типовых языках программирования могут быть воспроизведены путем подачи результатов обратно на входные узлы. При формировании итерационного кода часто применяются переменные цикла, уве-личиваемые после каждого прохода тела цикла. Последний завершается, когда переменная цикла достигает определенного значения. Метод применим и при потоковой обработке (рис. 14.5).
Рис. 14.5. Циклы при потоковой обработке
Все известные потоковые вычислительные системы можно разделить на два основных типа: статические и динамические. В свою очередь, динамические потоковые ВС обычно реализуются по одной из двух схем: архитектуре с помеченными токенами и архитектуре с явно адресуемыми токенами.
В потоковых ВС программа вычислений соответствует потоковому графу, который хранится в памяти системы в виде таблицы. На рис. 14.6 показаны пример графа потоковой программы и содержание адекватной ему таблицы.
Рис. 14.6. Пример формы хранения потоковой программы: а – потоковый граф; б – память функционального блока
Принципиальная схема потоковой ВС (рис. 14.7) включает в себя блок уп-равления (CS), где хранится потоковый граф, который используется для выбор- ки обрабатываемых команд, а также функциональный блок (FS), выполняющий команду, переданную из CS, и возвращающий результат ее выполнения в CS.
Рис. 14.7. Структура потоковой вычислительной системы
Блоки CS и FS работают асинхронно и параллельно, обмениваясь много-численными пакетами команд и результатами их выполнения. В пакете результата, поступающем из блока FS, содержится значение результата (val) и адрес команды, для которой пакет предназначен (des). На основании этого ад- реса блок CS проверяет возможность обработки команды. Команда может быть однооперандной или двухоперандной. В последнем случае необходимо под-тверждение наличия обоих операндов (opr 1 и opr 2), для чего устанавливается специальный признак. Блок управления загрузкой (LC) каждый раз при акти-вировании определенной функции загружает из памяти программ код этой функции.
Для повышения степени параллелизма блоки CS и FS строятся по мо-дульному принципу, а графы потоковой программы распределяются между мо-дулями с помощью мультиплексирования.