РАБОТА НАД ТЕЗАУРУСОМ КАК ОДИН ИЗ ВОЗМОЖНЫХ СПОСОБОВ НОРМАЛИЗАЦИИ ПРАВОВОЙ ТЕРМИНОЛОГИИ
Одним из основных аспектов анализа общелитературной лексики является исследование семантических процессов (синонимия, полисемия, омонимия, антонимия и др.)- И поскольку терминологическая система любого подъязыка, являясь частью общелитературного языка1, подчинена общим тенденциям его развития, то анализ терминологической лексики проводится по тем же аспектам, которые традиционно применяются для анализа лексики общелитературного языка. При этом анализ терминологии с точки зрения ранее упомянутых семантических процессов является важным фактором в работе над тезаурусом, поскольку последний, рассматриваемый прежде всего как нормативный словарь-справочник, должен однозначно истолковывать каждое понятие.
Так как одной из принципиальных проблем применения языков, согласно известному документалисту Ч. Мидоу, является распознавание сходных слов или сходных понятий1, то анализ лексики подчинен в основном решению именно этой проблемы. Одним из эффективных способов ее решения является объединение близких по смыслу или написанию слов. Достигаемая в таком случае обозримость терминологического материала значительно облегчает его анализ и это способствует более точному распознаванию полисемии, омонимии и синонимии. Применительно к созданию тезауруса проблема, связанная, например, с выявлением и устранением синонимии, решается путем объединения в отдельные группы (классы) всех синонимичных или условно синонимичных по смыслу ключевых слов, отобранных из текстов документов, и обозначения каждого класса смысловой доминантой (дескриптором), выбранной из числа слов обозначаемого класса, выражающей главное значение этих слов и обладающей большой смысловой точностью. Такое объединение слов именуется классом условной эквивалентности. При этом все ключевые слова, входящие в класс и снабжаемые отсьїлкоі;
1 Терминология рассматривается как часть словарного состава языка охватывающая специальную лексику, применимую в сфере профессиональной деятельности люден (БСЭ, т. 42, с. 302).
2 См. Ч. Мидоу, Анализ информационно-поисковых систем, М., 1970 с. 80.
52
к дескриптору, заменяются последним в процессе индексирования и поиска. «Информационно-поисковый язык, таким образом, вместо разнообразия синонимичных ключевых слов (в идеальном случае) имеет дело с единственным репрезентантом-дескриптором» 3.
С введением в ИПЯ классов условной эквивалентности процедура информационного поиска значительно упрощается, так как при индексировании документов и запросов, имеющих одинаковое смысловое содержание, но выраженных различными словами, им будут присваиваться поисковые образы, т. е. краткие характеристики, состоящие из одних и тех же дескрипторов. В этом случае потребитель получит ответ на запрос, даже если использует только знакомую ему терминологию.
Между тем проблема объединения сходных слов и выбора смысловой доминанты (дескриптора) в условиях создания Общеправового тезауруса является не только проблемой поиска информации. Одновременно с упрощением процедуры информационного поиска объединение сходных слов в классы способствует и решению определенных терминологических задач. Это обусловлено тем, что эффективность применения норм права, как известно, находится в прямой зависимости от качества используемой в них терминологии. Объединение в тезаурусе различных (порой неправильных и противоречащих друг другу) языковых форм выражения одного и того же понятия и выбор правильной формы делает тезаурус нормализующим инструментом в отношении регулирования правовой терминологии. Так, объединяя в одном классе такие взятые из различных нормативных актов слова, как «рабочий стаж», «стаж работы», «производственный стаж», «трудовой стаж» и обозначая этот класс термином «трудовой стаж», наиболее точно (с точки зрения закона) выражающим значение всех слов класса, мы тем самым достигаем определенного терминологического единства.
«Основное преимущество работы с тезаурусом, — пишет К. Штайнбух, — заключается в возможности добиться терминологического единства в рамках осуществляемого анализа путем подведения синонимичных терминов под один общий родовой термин — дескриптор и использования перекрестных ссылок» 4.
3 Д. Варга, Методика подготовки информационных тезаурусов («Сбор
ник переводов по вопросам информационной теории и практики», М., 1970,
№ 17, с. 13).
4 К. Steinbuch, Zukunîtsauigaben der Informatienstechnic im Hinblick
f das Bibliotekswesen («Zeitschrift fur bibliotekswesen und Bibliogra
phie», 1968, В 15, N 5—6, S 291—306).
53
При разработке Общеправового тезауруса объединение сходных слов в классы и выбор из числа слов класса смысловой доминанты (дескриптора) оказывается довольно сложной процедурой, ввиду того, что лексика нормативных актов во многих случаях не является единой, и используется непоследовательно. И это не позволяет говорить о языке права как о формализованной системе, хотя многие заимствованные из общеразговорного языка слова, попадая в нормативный акт, становятся более определенными5. Законодатель стремится придать таким словам более точное значение и для определения одного и того же понятия употребляет, как правило, один и тот же термин, не используя его синонимов. Так, например, такие термины, как «сделка» и «договор», «собственность» и «владение», «жалоба» и «протест», «арест» и «задержание», «хищение» и «кража», «потерпевший» и «свидетель», «подозреваемый» и «обвиняемый», на первый взгляд, кажущиеся синонимами, в законодательных актах не ваимозаменяемы и каждый из них имеет свое специфически правовое содержание. И все же отсутствие единства и непоследовательное использование лексики в нормативных актах является фактом. Прежде всего — это следствие противоречивости терминологических систем различных отраслей науки и техники, их слабой согласованности между собой. Их лексика составляет значительную часть лексики нормативных актов. Поэтому создание Общеправового тезауруса в большой мере связано с анализом и унификацией терминологии, содержащейся в нормативных актах.
Анализ терминологии в условиях создания Общеправового тезауруса усложняется еще и тем, что сходные по смыслу слова могут не находиться в пределах одного нормативного предписания и даже одного нормативного акта. В таком случае непосредственное сравнение подобных слов невозможно. Поэтому необходимо применение метода, позволяющего объединить все близкие по смыслу слова, а именно: метода так называемого фасетного анализа, который и был применен при создании Общеправового тезауруса6.
5 Подобное явление отражает общую закономерность во взаимосвязи
общелитературной и специальной лексики. Как отмечают исследователи,
слово общелитературного языка, попадая в сферу употребления разных
функциональных стилей, обрастает множеством стилистических помет,
экспрессивных оттенков" значения, чего нет у терминов, когда они функ^
ционируют в пределах своей основной области, в специальной научной
или производственной сфере языка (См. В. П. Даниленко, Лексико-семач
тические и грамматические особенности слов-терминов. В кн. «Исследова
ния по русской терминологии», М., 1971, с. 12).
6 См. С. Н. Юсупов, Правовая терминология и ее интерпретация в
категориях фасетной классификации. «Проблемы совершенствования совет
ского законодательства», Труды ВНИИСЗ, вып. 9, 1977.
54
Обычно при анализе слов для установления сходства или тождественности между ними используется закон эквивалентности, который в общей форме гласит: один знак может быть эквивалентен другому. Но применительно к созданию ИПЯ данный закон используется, во-первых, с учетом особенностей всего естественного язьїка (например, русского), а во-вторых, конкретного подъязыка, на базе которого создается ИПЯ. В первом случае, по мнению некоторых авторов, это связано с тем, что «синонимии, как она традиционно понимается, з языке вообще нет»7. Второй случай характеризуется тем, что в рамках конкретного подъязыка синонимичными (эквивалентными) могут считаться слова, не являющиеся таковьі-ми. К числу таких слов можно отнести ранее приводимый ряд слов — трудовой стаж, стаж работы, рабочий стаж и производственный стаж. Эти слова, помимо некоторых черт сходства, имеют и различия. Однако в нормативных актах они употребляются в одном значении. В силу этого следует говорить об условной эквивалентности. Поэтому в теории и практике дескрипторных систем в основу объединения близких по смыслу слов кладется критерий условной эквивалентности, базирующийся в основном на прагматическом подходе. При этом используется следующее положение, сформулированное Э. С. Бернштейном: «Если слово (часть слова, группа слов) в любом тексте информационного массива, обслуживаемого поисковой системой, может быть заменено другим словом (частью слова, группой слов) так, что на любой разумный запрос выдача происходит так же, как до замены, то такие слова (части слова, группы слов) считаются эквивалентными по смыслу в сфере действия поисковой системы» 8.
Такая интерпретация эквивалентности позволяет включать в класс условной эквивалентности семантически родственные слова, которые потенциально можно считать эквивалентными, подвергать сравнению и анализу многочисленные формы выражения этих слов и обнаруживать расхождения терминологии, содержащейся в законодательстве. Будучи концентрированным выражением информации по тому или иному вопросу, существующему в законодательстве, класс условной эквивалентности становится, таким образом, средством сравнения терминологии, содержащейся в нормативных актах и относящейся к одним и тем же вопросам. Это
В. А. Звягинцев, Теоретическая и прикладная лингвистика, М., 1968,
Э. С Бернштейн, Формализованный язык и критерий смыслового оответствия ИПС «ГКсто-Непусто» («НТИ», 1963, № 12, с. 31—39).
55
средство можно использовать и для сравнения терминологии, содержащейся в законодательстве разных отраслей и уровней.
Так, объединив в класс условной эквивалентности термины из уголовного и уголовно-процессуального законодательства, обозначающие одно и то же процессуальное действие, легко обнаружить различные формы выражения этих терминов — «дача заведомо ложных показаний» и «заведомо ложные показания». То же самое можно заметить при объединении в одном классе всех терминов из союзного и республиканского законодательства, обозначающих одни и те же по степени тяжести телесные повреждения. Замена различных форм выражения одной, наиболее подходящей с точки зрения норм правовой терминологии формой, способствует унификации лексики закона.
Однако создание тезауруса как инструмента, обеспечивающего терминологическое единство лексики нормативных актов, осуществимо в случае, если отбираемые в качестве дескрипторов слова будут точными, краткими, нести максимум информации о соответствующих им понятиях, т. е. в значительной степени отвечать тем же требованиям, что и термин. Вследствие этого принцип, согласно которому в качестве смысловой доминанты (дескриптора) может выступать любое слово из состава условно эквивалентных слов, неприемлем для правового тезауруса9.
При выборе из состава условно эквивалентных слов смысловой доминанты (дескриптора) необходимо руководствоваться теми же критериями, что и при отборе ключевых слов из текста; частотой их встречаемости в тексте, предполагаемой ценностью и значимостью при поиске, приемлемостью слова как термина. Кроме того, дескритор должен еще отвечать основному требованию дескрипторных систем, а именно: возможностью его использования для координации с другими дескрипторами в целях отражения новых понятий.
Очевидно, такой дескриптор должен быть выражен кратким термином. Сложные слова и словосочетания могут быть использованы лишь в двух- или, в крайнем случае, трехэлементных соединениях. Словосочетания, состоящие из трех слов, уже являются громоздкими для употребления. Так, если вместо сложного словосочетания «выдача денежных средств
9 См. Э. С. Бершитейн и др. Информационно-поисковые системы, M , 1965, с. 21. Неприемлема для правового тезауруса и рекомендация считать дескриптором ключевое слово, стоящее раньше других в алфавитном по рядке (См. Р. И. Пушкарская, Логика и язык дескрипторной системы автоматического составления предметного указателя. «НТИ», сер. 2, 1968. № 12, с. 13).
56
для зарплаты» мы используем в качестве дескрипторов отдельные его компоненты — «выдача», «зарплата», «денежные средства», то путем их координации можно выразить (или образовать) следующие понятия: «выдача зарплаты»,, «выдача денежных средств», «денежные средства для зарплаты». Поэтому при выборе дескриптора предпочтение следует отдавать более кратким терминам, если это не уменьшит их точности, так как требование краткости часто приходит в противоречие с требованием точности. В связи с этим членение сложных словосочетаний на отдельные компоненты производится в Общеправовом тезаурусе только в случаях/ когда словосочетания не обозначают термины, несущие в себе сугубо правовое содержание. Отход от этого принципа мог бы привести к положению, когда значительное число реально используемых в текстах закона терминов либо не вошло бы в тезаурус, либЪ оказалось бы в нем в качестве одноэлементных ключевых слов-синонимов дескриптора, т. е. слов, поставленных «вне закона». Очевидно, тезаурус с таким словарным составом не смог бы выполнить одну из своих основных функций — служить терминологическим пособием.
Необходимость включения в тезаурус терминов-словосочетаний базируется на следующей предпосылке: если основной лексической единицей в дескрипторных системах все же является одноэлементное понятие и в этом случае появляется большая возможность для составления различных комбинаций понятий, то основной «единицей смысла» в ИПС следует считать не слово, а словосочетание 10. Эта точка зрения основана на идиоматичности терминологических словосочетаний: содержание, передаваемое таким словосочетанием, не может быть выведено из слов, входящих в словосочетание. Однословные термины предлагается рассматривать, как частные случаи словосочетаний и.
Сопоставление различных вариантов выражений сходных по смыслу понятий и фраз и выбор оптимального варианта в некоторых случаях связаны с языковой избыточностью, наблюдаемой иногда в языке законодательства. Подобная избыточность проистекает из потребности стиля, обычаев употребления, требования структуры правовой нормы и нормативного акта в целом.
Касаясь этой особенности, А. С. Пиголкин пишет, что сти-•Ію языка законодательства в некоторых случаях свойственны
10 См. 3. Б. Баранова, Е. Б. Черная, Алгоритмическое составление
списка ключевых слов и словосочетаний («НТИ», сер 2, 1971, № 5, с. 16).
11 См. Г. Г. Белоногое, Об использовании терминологических словосо
четаний в автоматизированных информационно-поисковых системах. В сб.
«Цифровая вычислительная техника и программирование», М., 1967, с. 24.
57
«частое употребление стереотипных оборотов и выражений, развернутые определения терминов» 12.
Однако некоторые формы избыточности справедливо расцениваются как недостатки языка правовых актов 13, которые в определенной степени могли быть устранены при наличии надлежащего терминологического пособия. Для выявления избыточности необходимо нахождение способа, позволяющего сопоставить и оценить различные варианты выражений и фраз.
Рассмотрим один из возможных приемов сопоставления .ключевых слов, выделяемых из правовых текстов, основанный на анализе текстовой избыточности правовых текстов 14.
Термин «избыточность» в его первоначальном смысле обозначал «меру неэкономического кодирования»15. В настоящее время в теории и практике разработки и эксплуатации дескрипторных ИПС этим термином (в сочетании с термином «индексирование») обозначается процедура избыточного индексирования, которая является мерой повышения эффективности работы ИПС.
Для сопоставления и оценки различных вариантов текста необходим анализ так называемой текстовой избыточности. Ею будем считать те элементы текста, которые не увеличивают в нем содержательной информации. Данное положение соответствует одному из основных требований к терминологическим конструкциям — отсутствию в термине избыточной информации. Определение избыточных элементов — важная задача в преобразовании единиц текста в единицы ИПЯ-
Для количественного определения меры текстовой избыточности вводится понятие «минимального порога», под которым понимается минимальное количество текста, необходимое для выражения его смысла. Так, минимальным порогом для фразы «период, опасный в пожарном отношении», будет двухчленное словосочетание «пожароопасный период», эквивалентное по смыслу первой фразе.
Очевидно, текстовую избыточность можно определить сравнением равнозначных по смыслу текстов. И если по количеству элементов один текст больше другого, можно пред-
12 А. С. Пиголкин, Проблемы совершенствования языка правовых ак
тов и юридической терминологии, Тезисы докладов. Рига, 1970, с. 30—38
13 См. С. Боголюбов, Язык правоприменительных актов («Советская
юстиция», 1973, № 15, с. 21).
14 Предлагаемый прием основан на концепции, предложенной
Т. Н. Никитиной и М. И. Откупщиковой. См. Т. Н. Никитина, М. И. От
купщикова, К вопросу о текстовой избыточности («НТИ», сер. 2, № 7
1970, с. 7—9).
lD «Использование избыточности в информационных системах», Л 1970, с. 13.
58
положить, что один из них избыточен. Из этого следует, что, если устранение тех или иных элементов из конкретного текста не уменьшит количества информации, содержащейся в нем, то такие элементы следует считать избыточными для данного текста.
Рассмотрим некоторые случаи текстовой избыточности в нормативных актах. При этом могут быть выделены две ситуации: 1) устранение элементов текста без существенного преобразования его синтаксической структуры и 2) устранение, ведущее к изменению синтаксической структуры текста.
В первом случае избыточными являются: а) Фразы, где имеется полная или частичная тавтология, например: опасный вредитель лесов = вредитель леса; сведения о личности обвиняемого = сведения об обвиняемом; б) Определения, констатирующие естественное существование объекта или указывающие на способ его естественного возникновения, например: произведенный обыск; в) Определения, говорящие о типичном действии данного объекта, являющемся его основной функцией, например: занятие промыслом = промысел, производство кредитования = кредитование, процесс заготовки леса = заготовка леса, операция снабжения = снабжение, осуществление строительства = строительство, дача заведомо ложных показаний = заведомо ложные показания 16. Следует отметить, что в последней паре фраз первая, несущая в себе элемент избыточности, встречается в уголовно-процессуальном, а вторая — в уголовном законодательстве, что свидетельствует о непоследовательности в использовании терминологии даже в отраслях, с тесно соприкасающейся проблематикой; г) Оценочные определения, приписываемые объектам, равнозначные дублированию, например: строительство новых предприятий = строительство предприятий; д) Определения, выражающие признаки, указывающие на принадлежность термина, обозначающего объект, к той или иной отрасли законодательства. Обычно такие определения приписываются терминам, «мигрирующим» из одной отрасли законодательства в другую, для сохранения за ними их специфически отраслевого характера. Например, гражданско-правовые термины «иск», «истец» и «ответчик», попадая в уголовно-про-Цессуальное законодательство, неоправдано дополняются прилагательным «гражданский», что мешает их одинаковому пониманию.
Очевидные (тривиальные) выводы, встречающиеся в самом тексте, также следует оценивать как избыточные, напри-
16 См. £. Л. Прянишников, Терминология уголовно-процессуального законодательства («Правоведение». 1968. № 6. с. 95).
59
мер: ответственность возлагается на Советы Министров трех республик — Латвийской ССР, Эстонской ССР, Литовской ССР. Весьма часто в нормах для обозначения существования какого-нибудь факта в текст вводятся специальные слова, например, наличие или существование факта нарушения правил.
Вторая ситуация связана с устранением элементов текста: она предусматривает изменение синтаксической структуры словосочетания путем замены двух-, трех- или четырехэле-ментных словосочетаний одно- или двухэлементным термином. Например: организация, занятая торговлей = торговая организация; завод, производящий машинное оборудование = машиностроительный завод; строительство жилых домов = жилищное строительство; новый вид профессии = новая профессия; лес, имеющий почвозащитное значение = почвозащитный лес; специалист по составлению проектов = проектировщик; сезонный характер работы = сезонная работа; составление проектов = проектирование; постановление о привлечении в качестве обвиняемого = постановление о предъявлении обвинения, и т. п.
К числу избыточных можно отнести слова, выражающие признаки, которые хотя и имеются у тех или иных предметов, но их не характеризуют, не содержат в себе никаких специфических свойств предмета и поэтому не дают никакой новой информации о данном предмете (ср. «финансовый контроль» и «строгий контроль»; «юридический факт» и «важный факт»).
Разумеется, упрощение поискового языка требует определенных жертв в отношении оттенков естественного языка. Одной из основных задач при разработке тезауруса является «стремление к унификации, стандартизации, упрощению формы выражения, хотя бы и ценой неизбежного упрощения мысли»17. Но применяемые способы позволяют приносить в жертву наименее существенные элементы информации. Подобное упрощение увеличивает степень формализации информационного языка, повышая тем самым его поисковые возможности. Устранение синонимии, полисемии, а также элементов избыточности — это стремление к устранению возможности многозначного толкования, обеспечению более четкой связи между текстом и смыслом. Преимущество работы над тезаурусом заключается в том, что объектом анализа терминологической лексики являются тексты действующих законодательных и иных нормативных актов18. Поэтом \
17 Д. Варга, упом. соч., с. 13.
18 Согласно В. П. Даниленко терминологические исследования часто
имеют своим объектом не сферу функционирования терминологии — нау-
60
составленный на базе лексики конкретного нормативно-правового материала и ее тщательной семантической обработки тезаурус может представлять собой исчерпывающую систематизацию реально существующей правовой терминологии и служить основой для разработки пособия, способного стать семантическим стандартом, нормализующим инструментом в отношении регулирования правовой терминологии 19.
Из сказанного следует, что работа над тезаурусом и его использование протекает в двух направлениях — прямом и обратном. Прямом — использование лексики нормативно-правового материала для формирования словарного состава тезауруса; обратном — использование тезауруса для нормализации правовой терминологии. Иными словами, связь тезауруса с правом в известной мере является отражением одного из основных принципов кибернетики — принципа обратной связи. Применительно к рассматриваемой проблеме данный принцип мог бы найти воплощение в следующей модели: терминологическая система права — тезаурус — улучшенная терминологическая система права.
В пределах этой модели «приемник»-тезаурус, формируемый на основе лексико-семантической обработки текстов нормативно-правового материала, воздействует на функционирование «передатчика» — текст нормативно-правового материала и улучшает его.
Зав. лабораторией В. К. ДАВЫДЕНКО
«все книги «к разделу «содержание Глав: 22 Главы: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. >