Принципы классификации тезаурусов английского языка
Принципы классификации тезаурусов английского языка
Принципы классификации тезаурусов английского языка
И. А. Воронцова
Проблема
составления классификации тезаурусов не нова и в течение нескольких десятков
лет привлекала внимание ряда отечественных и зарубежных лингвистов (В. В.
Морковкин, Л. П. Ступин, К. Марелло и др.). Результатом исследований в этой
области стало создание альтернативных классификаций указанных
лексикографических произведений. Однако, на наш взгляд, авторы были не всегда
последовательны в выделении типов тезаурусов, иногда пренебрегая принципом
единого критерия классификации и, таким образом, нарушая ее логику. Кроме того,
указанные классификации являются довольно схематичными и не отражают всех
разновидностей словарей-тезаурусов. Тем не менее, предшествующая разработка
данного вопроса дает существенный положительный опыт, основываясь на котором мы
в настоящее время предпринимаем попытку создания собственной классификации
словарей-тезаурусов. Классификация строится, главным образом, на материале
современных тезаурусов английского языка с учетом вновь появившихся
лексикографических произведений, представленных в печатном и электронном
вариантах (см. «Список используемых словарей»). В основу данной классификации
положены следующие критерии:
1.
Тип смысловых связей между единицами словника;
2.
Объем словника;
3.
Генерализованность словника;
4.
Разработка значения лексем;
5.
Грамматико-стилистическая квалификация лексем;
6.
Демонстрация функционирования лексем;
7.
Количество представленных языков;
8.
Тип семиотических средств, используемых для семантизации лексем.
Классификация
основывается на созданных ранее классификациях О.М. Карповой [2] и И. Бурханова
[5], а также на собственных результатах обзора более 30 словарей-тезаурусов
(см. «Список используемых словарей»). Терминология, используемая в
классификации, введена в лексикографический аппарат В.В. Морковкиным [3], Ю.Н.
Карауловым Ю.Н. [1], И. Бурхановым [5], К. Марелло [6]. Критерии классификации
сформулированы О.М. Карповой [2] и автором настоящей статьи; формулировки
критериев 2, 7 принадлежат Л.П. Ступину [4]. Для максимально полного
отображения типов существующих словарей-тезаурусов предлагаем создать
многоуровневую классификацию. Во-первых, по типу смысловых связей между
единицами словника тезаурусы подразделяются на три крупных класса:
Три
данные типа тезаурусов отражают следующие виды смысловых связей лексем
соответственно: (1) Предметные или тематические связи, где объединение слов в
одну группу происходит в силу сходства или общности функций обозначаемых
словами предметов и процессов: предметы домашнего обихода, части тела, виды
одежды, постройки и т.д. Таким образом, идеографический тезаурус - это
лексикографическое произведение, представляющее лексические единицы в составе
предметных (тематических) групп и организующее их в иерархическую структуру,
предназначенную для репрезентации онцептуализированного знания о мире [22].
(2)
Лексико-семантические связи; объединение в группы с таким типом связи
происходит по основному для слов признаку -лексическому значению. При этом
также учитываются лексико-грамматические связи, в форме которых реализуются
отдельные значения слов. Таким образом, аналогический тезаурус - это
лексикографический справочник, основной единицей макроструктуры которого
является лексико-семантическая группа; группы систематизированы в порядке
алфавитного следования смысловых доминант [27].
(3)
Семантико-синтаксические связи, на основании которых слова объединяются в
группы или пары, предопределенные в своем возникновении и существовании
двойными связями: смысловыми и синтаксическими. Смысловые связи слов
устанавливаются, главным образом, между глаголами и прилагательными,
выполняющими предикативную функцию в предложении, и существительными, например,
-
между действием и органом (инструментом), при помощи которого оно совершается:
хватать - рука, видеть - глаз, плыть - лодка и т.д.
-
между глаголами действия, требующими одного субъекта, и субъектом: лаять -
собака, ржать - лошадь и т.д.
-
между глаголами и определенным грамматическим дополнением, которого первые
требуют: рубить - дерево, есть -еда и т.д. Отсюда ассоциативный тезаурус - это
словарь-тезаурус, организующий лексические единицы на основании существующих
между ними смысловых и синтаксических связей и располагающий группы в
соответствии с графической формой слов-центров [13].
В
рамках того же критерия проводим дальнейшее подразделение типов. Так,
идеографический тезаурус представлен 4-мя следующими типами:
1.
Собственно идеографический тезаурус;
2.
Тематический словарь;
3.
Систематический словарь;
4.
Тематико-систематический словарь (терминология И. Бурханова [5]).
Собственно
идеографический тезаурус -это особый тип идеографического словаря,
макроструктура которого организуется в соответствии с синоптической картой a
priori, наложенной на лексический состав языка. В отличие от других типов
идеографического словаря, собственно идеографический тезаурус характеризуется
логичной и строго упорядоченной классификационной структурой, созданной на
основе научной таксономии, даже если лексикографическому описанию подвергается
общая лексика [23]. Тематический словарь - это особый тип идеографического
тезауруса, основной единицей макроструктуры которого является тематическая
группа, включающая лексемы, объединенные на основе классификации их денотатов
(референтов) и рассматриваемые с точки зрения соответствия определенной теме.
Наличие
синоптической карты в тематическом словаре является факультативным.
Тематические словари, как правило, создаются для удовлетворения нужд иноязычных
пользователей, поэтому список тем в таком словаре определяется степенью их
значимости в коммуникативном пространстве пользователя [29]. Систематический
словарь - это особый тип идеографического тезауруса, классификационная
структура которого предназначена для представления действительных семантических
отношений, существующих между лексическими единицами языка. По своей сути
классификационная структура представляет лексико-грамматическую классификацию
вокабуляра, иными словами, его парадигматическую структуру, описанную с точки
зрения подчинения и сочинения [30].
Тематико-систематический
словарь -это особый тип идеографического словаря, представляющий собой
сочетание тематического и систематического словаря [9].
Аналогический
тезаурус, в свою очередь, подразделяется на 2 типа:
1.
Собственно аналогический тезаурус [26];
2.
Словарь синонимов / антонимов [15].
Считаем
данное разделение правомочным на следующем основании. Ограничение
лексико-семантических групп может проводиться по всему смысловому объему
данного слова или по линии лишь некоторых его значений. Слова, пересекающиеся
по одному значению и находящиеся в однотипных смысловых отношениях, образуют
синонимический ряд, что всегда меньше по объему, чем лексико-семантическая
группа.
Таким
образом, словарь, отражающий сугубо синонимические / антонимические отношения
слов, можно считать отдельным типом аналогического тезауруса (словарь
синонимов, антонимов). Опираясь на мнение Ю.Н. Караулова [1], полагаем, что
ассоциативный тезаурус также подразделяется на подтипы:
1.
Ассоциативный словарь одного предъявления (условно, термин наш); [10];
2.
Собственно ассоциативный тезаурус (термин Ю.Н. Караулова Ю.Н. [1]).
Их
принципиальное отличие состоит в следующем:
a)
Число стимулов в ассоциативных словарях 100 - 200; в ассоциативных тезаурусах -
около 1000.
b)
Обычный ассоциативный словарь строится по результатам однократного предъявления
стимулов; программа составления ассоциативного тезауруса предусматривает три
этапа: первый этап не отличается от традиционных ассоциативных экспериментов
(по его итогам получается обычный ассоциативный словарь); на втором этапе в
качестве стимулов используются реакции первого этапа; третий этап предполагает
процедуру повторения второго этапа с использованием реакций этого этапа в
качестве стимулов. Ассоциативное семантическое пространство после третьего этапа
замыкается, так как не происходит приращения новых слов и смыслов в реакциях.
Таким образом, ассоциативный тезаурус моделирует относительно замкнутое
лексико-семантическое и грамматическое пространство, обслуживающее языковую
жизнь социума. Во-вторых, с точки зрения объема словника практически все
существующие тезаурусы относятся к малым словарям, хотя количество лексических
единиц, включенных в тот или иной справочник, различно ([22] -около 150 тыс.;
[36] - около 800). Необходимо отметить, что в силу присущих им по их
лексикографической природе черт тематические, тематико- систематические
словари, словари синонимов/антонимов и ассоциативные тезаурусы издаются,
главным образом, в малом объеме. В-третьих, в отношении генерализованности /
специфичности словника тезаурусы подразделяются на общие и специальные. Общие
тезаурусы отражают лексику общелитературного языка [28]. Специальные тезаурусы,
в основном, отражают лексику языковых стилей:
1.
тезаурусы литературного языка могут быть представлены словарями языка писателя
или отдельного произведения, словарем эвфемизмов и т.д. [25; 19];
2.
разговорный стиль может быть представлен словарем сленга [24];
3.
территориальные языковые особенности раскрываются в диалектном идеографическом
словаре [17];
4.
язык науки отражается в научно-технических тезаурусах (терминов) [31] и т.д.
Следует
упомянуть, что нами не были проанализированы специальные систематические,
тематико-систематические словари, специальные словари синонимов / антонимов и
специальные ассоциативные словари-тезаурусы.
В-четвертых,
с точки зрения разработки значения лексем, существующие тезаурусы делятся на
три основных категории:
1.
Кумулятивные - представляющие собой группировки лексем без определения их
значений [20];
2.
Дефинитивные - содержащие одноязычное толкование каждой лексической единицы
группировки (терминология К. Марелло [6]) [21];
3.
Переводные - раскрывающие смысл лексической единицы посредством другого языка
[12].
Следует
признать, что доминирующее положение пока сохраняют кумулятивные тезаурусы. Это
прежде всего касается идеографических тезаурусов, ибо, исходя из положения о
том, что данный тип словаря предназначен для носителей языка и призван, по
возможности, охватывать весь лексический массив языка, определение каждой
лексической единицы сделало бы его излишне громоздким и неудобным для
пользователя. Однако словари нового поколения все чаще содержат определения и
пополняют группу дефинитивных тезаурусов (главным образом, аналогические
тезаурусы) [18]. В-пятых и в-шестых, в отношении грамматико-стилистической
квалификации, а также демонстрации функционирования лексем, существующие
тезаурусы можно подразделить на полные и дифференцированные. Полные тезаурусы
содержат исчерпывающие добавочные семантико-функциональные характеристики
(ДСФХ) и богатый иллюстративный материал [18]; соответственно, в
дифференцированных тезаурусах система помет и иллюстративные примеры более
скудные [33]. В-седьмых, по количеству представленных языков выделяются одно- и
двуязычные тезаурусы. На наш взгляд, возможны также и многоязычные
лексикографические произведения такого рода [34; 11]. В-восьмых, с точки зрения
типа семиотических средств, используемых для семантизации лексем, можно
говорить о тезаурусах традиционного печатного исполнения [26], иллюстративных
(картинных) словарях [16] и словарях со смешанными семиотическими средствами
[21]. Новым словом в мировой лексикографии является комбинированный словарь.
Основное его отличие - использование нескольких способов организации лексики.
Алфавитный порядок слов в словнике, как правило, сочетается с индексом- тезаурусом,
в котором все лексические единицы, представленные в словаре, объединяются в
группы согласно области их использования или понятия, которое они выражают.
Таким образом, можно выделить толково-идеографический (комбинированный) словарь
[7], толково-аналогический (комбинированный) словарь [32] и (потенциально)
толково-ассоциативный (комбинированный) словарь. Растет число электронных
комбинированных словарей, одновременно совмещающих в себе толковый, аналогический
словари и, косвенно, словарь сочетаемости [35]. Популярность приобретают
специальные одно- и двуязычные словари, содержащие как лингвистическую, так и
энциклопедическую информацию; проанализированные нами словари подобного рода в
целом систематизируют лексику по общности графической формы, т.е. по алфавиту,
но также снабжены подробным тематическим приложением. Более того, благодаря
системе гиперссылок приложения пользователь может без труда обращаться к
статьям денотативно связанных лексем, лексем-гипонимов (гиперонимов) и т.п.
Такие словари-тезаурусы можно условно обозначить как
лингвистико-энциклопедические комбинированные словари [8]. Кроме того,
благодаря усовершенствованным техническим возможностям словарей расширяются
ДСФХ лексем; свидетельством того являются, например, озвученные словари,
словарные статьи которых дают аудиопредставление лексем [14].