Ипя виды структура требования. Структура и назначение ипя Основное значение базы данных
Говоря об организационной структуре, мы имеем в виду концептуальную схему, вокруг которой организуется группа людей, основу, на которой держатся все функции. Организационная структура предприятия — это, по сути, руководство для пользования, которое объясняет, как организация выстроена и как она работает. Если говорить конкретнее, то организационная структура описывает, как в компании принимаются решения и кто является ее лидером.
Почему необходимо разрабатывать организационную структуру предприятия?
- Организационная структура дает четкое понимание того, в каком направлении движется компания. Ясная структура — это инструмент, с помощью которого можно придерживаться порядка в принятии решений и преодолевать различные разногласия.
- Организационная структура связывает участников. Благодаря ей люди, присоединяющиеся к группе, имеют отличительные черты. В то же время и сама группа обладает определенными особенностями.
- Организационная структура формируется неизбежно. Любая организация по определению подразумевает какую-то структуру.
Элементы организационной структуры
Организационная структура любой организации будет зависеть от того, кто является ее участниками, какие задачи она решает и как далеко организация зашла в своем развитии.
Независимо от того, какую организационную структуру вы выбираете, три элемента всегда будут присутствовать в ней.
- Управление
Конкретный человек или группа людей, которые принимают решения в организации.
- Правила, по которым работает организация
Многие из этих правил могут быть заявлены явно, в то время как другие могут быть скрытыми, но при этом не менее обязательными для исполнения.
- Распределение труда
Распределение труда может быть формальным или неформальным, временным или постоянным, но в каждой организации непременно будет определенный тип распределения труда.
Традиционные организационные структуры
Эти структуры основаны на функциональном подразделении и отделах. Они характеризуются тем, что на верхнем уровне сосредоточены полномочия стратегических и оперативных задач.
Существует несколько типов традиционных структур.
- Линейная организационная структура
Самая простая структура из всех существующих. Характеризуется наличием определенной цепи инстанций. Решения спускаются сверху вниз. Этот вид структуры подходит для маленьких организаций вроде небольших бухгалтерских фирм и адвокатских контор. Линейная структура позволяет легко принимать решения.
Преимущества:
- Самый простой вид организационной структуры.
- В результате жесткого управления формируется жесткая дисциплина.
- Быстрые решения приводят к быстрым и эффективным действиям.
- В структурах власти и ответственности существует ясность.
- Поскольку контроль лежит на одном начальнике, в ряде случаев он может проявлять гибкость.
- Есть хорошие перспективы карьерного роста у людей, которые выполняют работу качественно.
Недостатки:
- Есть возможности оказывать влияние на начальника отдела.
- Постоянная проблема — отсутствие специализации.
- Начальник отдела может быть перегружен работой.
- Коммуникации осуществляются только сверху вниз.
- Начальник, обладающий властью, может неправильно использовать ее для своей выгоды.
- Решения принимаются одним человеком.
Линейно-штабная организация
Такая структура характеризуется наличием линейных руководителей и подразделений, которые по факту не имеют права принятия решений. Главная их задача — оказывать помощь линейному менеджеру в выполнении отдельных функций управления. Процесс принятия решений в такой структуре медленнее.
Преимущества:
- Позволяет сотрудникам быстро выполнять задачи.
- Помогает сотрудникам брать на себя ответственные функции и специализироваться на конкретных функциях.
- Помогает линейным руководителям сконцентрироваться на определенных задачах.
- При организационных изменениях минимален риск возникновения сопротивления.
- Сотрудники чувствуют, что их вклад оценен.
Недостатки:
- Среди сотрудников может возникать путаница.
- У сотрудников недостаточно знаний, чтобы ориентироваться на результат.
- Слишком много уровней иерархии.
- Сотрудники могут расходиться во мнениях, что замедляет работу.
- Более дорогостоящая структура, чем простая линейная организация, из-за наличия начальников подразделений.
- Решения могут приниматься слишком долго.
Функциональная структура
Этот вид организационной структуры классифицирует людей согласно функции, которую они выполняют в профессиональной жизни.
Преимущества:
- Высокая степень специализации.
- Ясный порядок подчиненности.
- Четкое понимание ответственности.
- Высокая эффективность и скорость.
- Отсутствие необходимости в дублировании работы.
- Все функции одинаково важны.
Недостатки:
- Коммуникация сталкивается с несколькими барьерами.
- В центре внимания находятся люди, а не организация.
- Решения, принятые единственным человеком, могут не всегда идти на пользу организации.
- По мере роста компании становится труднее осуществлять контроль над действиями внутри нее.
- Отсутствие командной работы между различными отделами или единицами.
- Поскольку все функции отделены, сотрудники могут не знать о том, что творится у коллег.
Дивизиональная структура
Сюда относятся виды структур, которые основаны на различных подразделениях в организации. Они группируют сотрудников на основе продуктов, рынков и географического положения.
- Продуктовая (товарная) структура
Такая структура основана на организации сотрудников и работы вокруг различных продуктов. Если компания производит три различных продукта, то у нее будут три различных подразделения для этих продуктов. Этот тип структуры лучше всего подходит для розничных магазинов с множеством продуктов.
Преимущества:
- Структурные единицы, которые не работают, можно легко закрыть.
- Каждая единица может управляться как отдельное структурное подразделение.
- Быстрое и легкое принятие решений.
- Большая независимость у лиц, принимающих решения.
- Отдельные продукты привлекают отдельное внимание в зависимости от проблем, которые возникают.
- Организация характеризуется высокой производительностью и эффективностью.
Недостатки:
- Поскольку каждая структурная единица работает самостоятельно, организационные цели не могут быть достигнуты.
- Нездоровая конкуренция среди внутренних подразделений.
- Большое количество организационных уровней препятствует развитию бизнеса.
- Все единицы не могут быть равнозначными.
- Маркетинг отдельных продуктов может сильно отличаться по стоимости.
Рыночная структура
Сотрудники группируются исходя из того, на каком рынке работает компания. У компании может быть пять различных рынков, согласно этой структуре каждый из них будет отдельным подразделением.
Преимущества:
- Сотрудники могут общаться с клиентами на местном языке.
- Они доступны клиентам.
- Проблемы на конкретном рынке могут решаться изолированно.
- Поскольку люди ответственны за конкретный рынок, задачи выполняются вовремя.
- Сотрудники специализируются на работе на конкретном рынке.
- Могут выводиться новые продукты для специализированных рынков.
Недостатки:
- Может возникнуть острая конкуренция среди сотрудников.
- Принятие решений может вызывать конфликты.
- Трудно определить производительность и эффективность.
- Все рынки могут не рассматриваться как равные.
- Может отсутствовать связь между начальниками и сотрудниками.
- Сотрудники могут неправильно использовать свои полномочия.
- Географическая структура
У крупных организаций есть офисы в различных местах. Организационная структура в этом случае следует за зональной структурой.
Преимущества:
- Хорошая коммуникация среди сотрудников в том же самом местоположении.
- Местные работники лучше знакомы с местной деловой средой и могут приспосабливаться к географическим и культурным особенностям.
- Клиенты чувствуют лучшую связь с местными менеджерами, которые могут говорить на их языке.
- Отчеты по работе отдельных рынков.
- Решения принимаются взвешенно.
- Могут вводиться новые продукты или модификации продуктов, удовлетворяющие потребности определенной области.
Недостатки:
- Может возникать нездоровая конкуренция среди различных географических зон.
- Этика компании и ее принципы могут отличаться от региона к региону.
- Отслеживание работы и прибыли каждой области может отнимать много времени.
- Возможна плохая коммуникация среди сотрудников в различных регионах.
- Взаимодействие между сотрудниками различных регионов может не сложиться.
Матричная структура
Это комбинация продуктовой и функциональной структур. Она объединяет преимущества обеих структур для большей эффективности. Эта структура самая сложная из существующих. Отличительная особенность матричной структуры — подчинение сотрудников двум или более руководителям одного уровня.
Существует функциональная матрица. В этом типе матричной структуры менеджеры по проекту следят за функциональными аспектами проекта. Однако они обладают очень ограниченной властью, фактически управляет ресурсами и проектом руководитель функционального подразделения.
Преимущества:
- Сотрудники не работают на временной работе.
- Руководитель функционального подразделения управляет проектом.
- Руководитель функционального подразделения несет ответственность в случае, если что-либо идет не так, как надо.
- Чем больше менеджер по проекту общается с сотрудниками, тем лучше результаты.
- Менеджер по проекту может реально повлиять на ситуацию, не будучи под контролем.
- Принятие решений сосредоточено в руках руководителя функционального подразделения.
Недостатки:
- Менеджер по проекту может столкнуться с апатией со стороны сотрудников.
- Менеджер по проекту не имеет полной власти.
- Будучи не контролируемыми, сотрудники могут показывать меньшую производительность всего подразделения.
- Менеджер по проекту обладает слабой властью, которая не позволяет ему контролировать сотрудников.
- Менеджер по проекту не имеет никакого контроля над управлением рабочей нагрузкой и определением приоритетов в задачах.
- Менеджер по проекту не может дать отчет о работе.
Есть еще проектная матрица, когда прежде всего ответственен за работу менеджер по проекту, в то время как руководитель функционального подразделения может давать методические консультации и распределять ресурсы.
Семное варьирование значения представляет собой приспособление значения-компетенции к коммуникативным условиям конкретного речевого акта, выражающееся в образовании тех или иных актуальных смыслов. Коммуникативная задача конкретного речевого акта определяет набор сем, подлежащих актуализации, т.е. «избирательную актуализацию семантических признаков значения» (Шмелев, 1983, с. 34; см. также: Бергельсон, Кибрик, 1981, с. 343; Брудный, 1972, с. 214; Солганик, 1981, с. 72; Языковая номинация. Виды наименований, 1977, с. 136 и др.).
Семное варьирование осуществляется на уровне отдельного значения (семемы), связано с выбором семантических компонентов, подлежащих актуализации в связи с определенной коммуникативной задачей и осуществляется посредством ряда семантических процессов, действующих в семеме на уровне отдельных сем. Рассмотрим эти процессы.
Актуализация семы есть коммуникативно обусловленное выделение семы в структуре значения, приводящее к восприятию ее участниками акта общения как коммуникативно релевантной, входящей в актуальный смысл слова. Актуализироваться может любая сема из структуры значения, как ядерная, так и периферийная. Те семы, которые не вошли в актуальный смысл слава, остаются неактуализован-ными. Иногда в таком случае говорят о погашении семы. Представляется, однако, что с точки зрения коммуникативного анализа значения особого процесса (Погашения сем выделить нельзя – коммуникативно нерелевантная сема лрос-то «игнорируется» в речевом акте, т.е. не актуализируется. В значении-компетенции (вне речевого акта) все семы не актуализованы, т.е. все они в равной мере погашены, и поэтому при актуализации одних семантических компонентов другие, коммуникативно нерелевантные, не нуждаются в каком-либо особом механизме погашения сем. Психофизиологической основой актуализации семы является возбуждение тех нейронных ансамблей коры головного мозга, которые кодируют информацию, отражаемую данной семой. Соответствующая сема не актуализируется, если не возбужден соответствующий нейронный участок. Проиллюстрируем, актуализацию разных сем в составе значения на примере употребления слова иголка.
Дай мне иголку, мне надо пришить пуговицу. Актуализируются семы «заостренный металлический стержень с ушком для вдевания нити, употребляемый для шитья».
Черный металл – это иголка и сковородка, плуг и локомотив (В. Чивилихин. Память). Актуализированы семы «предмет быта, первой необходимости».
Ночная молния вспыхнет, и все как на ладони. Иголку, и ту видно (Г. Марков. Моя военная нора). Актуализованы семы «небольшой предмет».
Смотрите, ваш ребенок схватил иголку! Актуальный смысл – «предмет, представляющий опасность, способный причинить боль».
В этот зазор даже иголка не пройдет. Актуализованы семы «тонкий, заостренный предмет».
Актуализация семы может быть осложнена одновременной актуализацией одноименной переносной семемы. Это явление мы обозначаем как процесс двойной актуализации семы, заключающийся в том, что сема, которая в языке одновременно выступает и как самостоятельная семема, может при своей актуализации вовлечь за собой актуализацию переносной семемы, сохраняющей с ней живую связь. Например, в значении слова бритва содержится яркая сильнове-роятностная сема «острая». В предложении «Не девка, а форменная бритва» (Ю. Семенов. ТАСС уполномочен заявить) – об острой на язык, язвительной девушке – актуализируется сема «острая», которая в свою очередь актуализирует переносное значение прилагательного «острый» – «остроумная, язвительная», что и составляет актуальный смысл слова бритва в данном коммуникативном акте. Таким образом, актуализованная сема одновременно осознается и как компонент значения коммуникативно реализуемого слова, и как переносное значение другой, не присутствующей в коммуникативном акте единицы.
Приведем еще примеры двойной актуализации сем: кремень-человек – актуализируется сема «твердый» и переносная семема «сильный, решительный»; аналогично – гранит, а не человек; воск, а не хорунжий – актуализована сема «мягкий» и переносная семема «кроткий, уступчивый, поддающийся воздействию»; скала-вратарь – актуализована сема «твердый» и переносное значение «надежный, устойчивый»; облачко грусти – актуализована сема «легкий» и переносная семема «слабый, незначительный, небольшой»; ты льдина, сосулька – актуализована сема «холодный» и переносная семема «равнодушный, бесстрастный» и т.д.
Иногда наблюдается двойная актуализация семы и содержания устойчивого словосочетания или фразеологизма. Например, Ну, ты снайпер! (о быстро догадавшемся человеке): актуализируется сема «точность попадания», которая актуализирует значение фразеологизма «попасть в точку». Слова некоторых тематических групп имеют тенденцию к двойной актуализации определенных сем. Так, наименования сладостей (пирожное, бисквит, конфета, персик и др.) часто используются в актуальном смысле «сладкий», актуализирующем переносную семему «приятный; доставляющий удовольствие» или семему «приторно-нежный, умильный»; наименования твердых предметов (камень, кремень, скала, металл и др.) часто актуализируют сему «твердый» и переносные семемы «надежный» или «решительный» и др.
Усиление семы представляет собой изменение яркости семы в сторону ее повышения. Оно приводит к тому, что та или иная сема в структуре актуализованного значения оказывается ярче по сравнению с другими семами, чем по отношению к ним же в структуре значения-компетенции. Ослабление семы представляет собой изменение яркости семы в сторону ее уменьшения. При формировании актуального смысла в коммуникативном акте усиление яркости одних сем автоматически ведет к ослаблению других, тоже актуализованных, так как на фоне более ярких сем они проигрывают, становятся менее заметными. На возможность подобного явления указывал W. Schmidt (1965, с. 54): «актуализованное значение слова не является монолитным, оно разложимо на элементы, одни из которых в условиях конкретного контекста усиливаются, доминируют, другие – отступают на задний план, могут исчезать и заменяться новыми».
На возможность различной по яркости актуализации отдельных семантических компонентов обращает внимание и Э.В. Кузнецова. Она приводит конкретные примеры изменения яркости сем в различных контекстах употребления слова: «в разных контекстах одно и то же слово с одним и тем же, судя по словарю, значением, может быть содержательно не вполне адекватным. Возьмем для иллюстрации этого положения глагол вытащить, значение которого определяется в словаре следующим образом: «Таща, извлечь, удалить откуда-либо; таща, вывести, вынести»... Во фразах, приведенных в качестве словарных иллюстраций, глагол вытащить осмысляется неоднозначно. Ср.: «Его [Дубенко] сонного вытащили из кузова и уложили на землю» (А. Попов). В этой фразе акцентируется признак «перемещение», смысл глагола вытащить ближе всего к значению глагола вынести. Так же осмысляется этот глагол и во фразе: «Были такие силачи, что могли вытащить на берег затонувшую лодку с водой» (Скиталец). В других фразах, например, «Иван Ильич вытащил из автомобиля кожаные плащи и погребец с провизией» (А. Толстой), в глаголе вытащить сильнее проявляются признаки «доетавания», «взятия», нежели признак «перемещения» (Кузнецова, 1980, с. 11).
Приведем еще пример коммуникативного изменения яркости сем. Значение слова штукатур – «рабочий, специалист по штукатурке».
Штукатуры приступили к отделке помещения. В актуальном смысле слова штукатур сема «специалист по штукатурке» выступает как наиболее яркая, а сема «рабочий» – как более слабая.
Придет, поработает, допустим, штукатуром, короткое время пройдет, смотришь, а он уже сидит в кабинете с вывеской (В. Кожевников. Там, где нет ни пыли, ни мух). В данном предложении сема «рабочий» усилена, сема «специалист по штукатурке» ослаблена; актуализована также периферийная сема «рядовая должность».
Могут быть ослаблены все яркие семы значения, как ядерные, так и периферийные, что приводит к образованию нечеткого актуального смысла. В этих случаях все актуали-зованные семы выступают одинаково неяркими, что и создает нечеткость актуального смысла, например слово инженер в конструкции типа «Инженер – не чиновник». Отметим, что само явление актуализации предполагает, что актуализованная сема обладает известной яркостью, в этом – сущность явления актуализации. Однако яркость актуализованных сем, как травило, различна, и в рамках актуального смысла слова всегда можно выделить более и менее яркие семантические компоненты.
Еще одним семным процессом при коммуникатизации значения является расщепление сем, под которым понимается неполная актуализация семы, т.е. актуализация в коммуникативном акте лишь части семы. Расщепляются эксплицитные семы; при этом часть эксплицитной семы, актуализирующаяся в коммуникативном акте, оказывается одной из скрытых сем данной эксплицитной семы. Это означает, что расщепление эксплицитной семы фактически представляет собой актуализацию одной из скрытых в ней сем. Но так как при коммуникативном описании значения мы всегда имеем дело с уровнем рассмотрения семемы, на котором семантические компоненты представлены как эксплицитные, мы и говорим о расщеплении сем.
Расщепление сем – семантический процесс, характерный для переносного употребления слова и не встречающийся при прямом употреблении. Наиболее часто расщепляются семы, содержащие в качестве скрытых компоненты, выражающие количественную и качественную оценку какого-либо объекта, при этом редуцируется компонент, указывающий на объект. Например (в скобках приводятся редуцированные, т.е. не актуализованные компоненты расщепленной эксплицитной семы): лавина мероприятий – обилие (снега), с бороной ребятишек – многочисленность (зубьев), муравейник эфира – многочисленность (муравьев), половодье зелени – обилие (воды), табун, стая, стадо – многочисленность (животных), дрожжи – вызывают увеличение, рост (теста), спринтер – быстрота (бега) и др. Нередко расщепляются семы, содержащие скрытую сему «часть», «элемент», «компонент» и др.: кирпичики памяти – элемент (здания), головной мозг корабля – основная часть управления (человеком), тылы книгохранилища – участок (расположения войск), гарнир – дополнительная часть (обеда) и др. Расщепляются семы, содержащие скрытый фазисный компонент: обрыв знаний – конец (ровной поверхности), финиш жизни – этап (соревнований) и др. При расщеплении эксплицитной семы всегда актуализируется та ее часть, которая имеет более обобщенный характер, семантический же объект чаще всего подвергается редукции.
Следующим семантическим процессом является модификация сем, которая заключается в контекстуальном переосмыслении содержания семного конкретизатора в рамках того или иного семантического признака. Как отмечал В. Скаличка, «любую или почти любую сему можно употребить в различном смысле» (1967, с. 143). Модификация семы бывает двух видов – смысловая, представляющая собой изменение содержания семы в коммуникативном акте, и модальная – придание семе модальной окраски. Рассмотрим сначала смысловую модификацию.
Семный конкретизатор, уточняющий тот или иной семантический признак в определенной семе, парадигматически противостоит другим семным конкретизаторам с этим же семантическим признаком. Например, семные конкретизаторы «большой», «маленький», «огромный» противостоят друг другу в рампах семантического признака «размер», семные конкретизаторы «юный», «взрослый», «молодой», «старый» противопоставлены друг другу по семантическому признаку «возраст» и т.д. Разумеется, противопоставленность сем осуществляется через противопоставленность слов, содержащих эти семы в системе языка. Каждый семный конкретизатор в подобной парадигме несет свой собственный семантический груз, очерчивает свою денотативную область. В определенных коммуникативных условиях та или иная сема, а точнее, тот или иной семный конкретизатор, может подвергнуться речевой модификации, т.е. переосмыслению. Сравним два примера:
А колхозное дело такое молодое, и страшно необходимое. Все должны быть за нас. И старушки, и женщины (М. Шолохов. Поднятая целина); Из темноты проступали лица девушек и женщин (Там же).
Семантический признак «возраст» в значении слова женщина представлен семой «взрослая», однако в первом примере эта сема осмысляется как «не старая», а во втором – как «не очень молодая». Следовательно, сема «взрослая» модифицируется в данных контекстах. Подчеркнем, что сама сема «взрослая» в значении слова женщина ни в первом, ни во втором случае не исчезает, а лишь выступает в модифицированном виде, приспособленном к условиям коммуникативного акта.
Как указывалось выше, семные конкретизаторы нечетких сем обладают абсолютным содержанием и значимостью. Необходимо разграничивать модификацию значимости семы в акте речи и актуализацию системных значимостеи таких сем.
Семные конкретизаторы нечетких сем могут иметь как абсолютное содержание, так и значимость, или обладать только значимостью и не иметь абсолютного содержания. Значимость семното конкретизатора, как отмечалось, возникает как следствие системной парадигматической ранжировки семных конкретизаторов по тому или иному семантическому признаку. К примеру, семантический признак «возраст» в значении слова женщина представлен семой «взрослая», содержащей полный семный коикретизатор: абсолютное содержание – «взрослая», значимость – «старше девочки, девушки, ребенка, младше старика, старухи и т.д.». А вот семантический признак «вес» в значении слова мальчик представлен семой с неполным семным конкретизатором: кроме самого семантического признака «вес», эта сема содержит только значимость по данному признаку – «больше младенца, портфеля, рыбы, книги, меньше мужчины, машины и т.д.»; абсолютного содержания семный коикретизатор в данном значении не имеет, нет компонента типа «тяжелый» или «легкий». При отсутствии как абсолютного содержания, так и значимости мы имеем дело с автономным семантическим признаком, например признак «возраст» в значении слова человек.
Абсолютное содержание конкретизатора нечеткой семы определяется только в рамках его собственной тематической группы, к примеру, размер или вес животного определяется только относительно других животных, возраст людей – относительно других людей, эффективность инструментов – относительно инструментов и т.д. Относительная же значимость семных конкретизаторов определяется в пределах всей парадигмы слова по данному семантическому признаку, включающей слова всех тематических групп, для единиц которых характерен данный семантический признак. Например, относительная значимость семного конкретизатора «дорогостоящий» в значении слова «Жигули» будет включать характеристику дороговизны «Жигулей» как но отношению к другим личным транспортным средствам («дешевле «Волги», дороже "мотоцикла, «Запорожца» и др.»), так и относительно других.предметов потребления («дороже пальто, книг, обуви, радиоприемника, дешевле бриллиантов, дома и др.»). Пр,и наличии в семе полного семного конкретизатора возможна актуализация его абсолютного содержания и значимости по отдельности. В следующем примере актуализова-но абсолютное содержание семы «дорогостоящий»:
Материально живем неплохо. Купили «Запорожец». Дочкой в школе довольны (Известия, 1981, 7 июля); Мать с отцом, всю жизнь проработавшие в поле, на ферме, в состоянии не только прокормить дитё, но и купить ему «Жигули» (Коммуна, 1981, 26 дек.).
Если же в коммуникативном акте возникает необходимость противопоставить значения по значимостям в рамках одного и того же семантического признака, то возможна актуализация только значимости:
Тут ни одной не было «Волги», но и ни одного «Москвича» или «Запорожца», тут царили только «Жигули». ...Деньги были, да, деньги у них были, но положение обязывало их не прыгать выше «Жигулей». Это все были торговые боссы из небольших магазинов, умный все народ, не вылезавший и не бахвалившийся тем, что имел (Л. Карелин. Змеелов). В данном примере в наименованиях автомобилей актуализованы значимости семы «дорогостоящий», а абсолютное содержание семного конкретизатора не актуализовано.
При актуализации сем с неполным семным конкретизатором обязательно необходим дифференцирующий контекст, как правило – вербальное противопоставление слов, обеспечивающих актуализацию конкретной значимости семы. Например: Тут не то что технике – бойцу не укрыться. В значении слова боец семный конкретизатор семантического признака «габариты» является неполным: абсолютная значимость отсутствует (боец – и не крупный, и не маленький, но значимость есть: «больше автомата, вещмешка и т.д., меньше пушки, танка, дзота и т.д.»). Конкретный дифференцирующий контекст обеспечил актуализацию именно данного компонента значимости – «меньше военной техники».
Наличие в семных ко.нкретизаторах сем относительной значимости ка.к реального семантического явления и возможность актуализации этой значимости в коммуникативном акте позволяют адекватно понимать многочисленные выражения типа Карась величиной с лопату (т.е. большой), Карась величиной с полтинник (т.е. маленький): в этих случаях актуализируется значимость семы с семантическим признаком «размер»; аналогично: кулаки с пудовые гири, кулаки как чайники, снежинка с ладонь, собака размером с кошку и др.
Значимости сем отражают реальные отношения предметом внешнего мира по определенным признакам и входят в языковую компетенцию носителей языка, отражаясь в семантике слов. Значимость несет дифференциальную информацию, но она содержательна, представляет собой реальный семантический компонент, хотя и выделяющийся в структуре значения только в пределах той или иной семы.
Дифференцирующий контекст, где эксплицитно выражены единицы, оппозиция которых создает ту или иную значимость, является обязательным условием актуализации данной значимости в коммуникативном акте и может служить формальным показателем актуализации значимости в том или ином контексте. При этом дифференцирующий контекст является необходимым независимо от того, актуализируется значимость неполного или полного семного конкретизатора. Разграничение модификации сем и актуализации значимости семы должно проводиться с учетом того, есть ли в данной семе абсолютное содержание у конкретизатора или только значимость. Модификации могут подвергаться только семы с полным семным конкретизатором, так как модифицируется всегда некоторое конкретное абсолютное содержание; если же абсолютное содержание у семного конкретизатора отсутствует, то о его модификации не может быть и речи – возможна только актуализация значимости. Если же актуализируется сема с полным семным конкретизатором, то абсолютное содержание может быть актуализовано в двух вариантах – с модификацией и без модификации.
При модификации конкретное содержание модифицированной семы описывается или допускает описание при помощи таких единиц метаязыка, как: «слишком, достаточно, недостаточно, очень, не очень, сравнительно, относительно и т.д. ... в данной ситуации» (в других ситуациях будет возможна другая оценка, другое осмысление данного признака).
Выше речь шла о смысловой модификации сем, заключающейся в изменении ее содержания. Второй тип модификации – модальная модификация, которая заключается в том, что в коммуникативном акте определенные семы приобретают модальную окраску, передаваемую в описании такими единицами метаязыка, как: должен, может, обязан, возможно и др. Например:
Как ты можешь так равнодушно относиться к сыну? Ты же отец! Сема «проявление заботы» модифицируется в «должен, обязан заботиться».
Маша заболела. – Ну, это не страшно, она ведь живет с матерью. Сема «забота о детях» модифицируется в «может позаботиться».
Модальной модификации подвергаются преимущественно диспозициональные, вероятностные семы.
Следующий рассматриваемый семантический процесс – конкрети за ц и я семы. Сема всегда представляет собой определенную абстракцию. Семы достаточно высокой степени абстракции представлены в коммуникативных актах в виде семных вариаций. По аналогии с фонетикой семные вариации можно назвать аллосемами. Аллосемы – это конкретные вариации семы, обусловленные коммуникативным намерением говорящего и воплощенные в конкретном лексическом значении. Они представлены в коммуникативном акте в семантике конкретных лексических единиц, и выбор той или иной единицы, содержащей аллосему, относится к сфере конкретизации коммуникативного намерения говорящего. Одна и та же сема может "быть представлена в речевом акте разными аллосемами. Так, сема «препятствие для деятельности людей» в разных коммуникативных ситуациях может выявиться в аллосемах «препятствует жизни, работе» (ремонт), «препятствует полетам самолетов» (туман), «препятствует обработке почвы» (ямы, кусты, овраги), «препятствует перемещению» (болота, джунгли) и т.д.
Сема «способность к перенесению трудностей» реализуется в виде аллосем «перенесение тяжелого физического труда», «способность к длительной изнурительной работе», «приспособленность к тяжелым климатическим условиям», «физическая сила», «способность нести большой груз» и др. Сема «наличие технических знаний» может выступать в виде аллосем «способность починить технику», «умение завести мотор», «умение обращаться с бытовыми приборами» и т.д. Семы низкой степени абстракции выступают, как правило, только в виде одной вариации (ср.: «одноместность», «четы-рехколесность», «наличие спинки» и др.).
Описание сем, имеющих единственную аллосему, не вызывает трудности, так как не содержит альтернативы. При наличии у семы нескольких аллосем встает вопрос о том, описывать ли непосредственно аллосему или ту сему, вариацией которой данная сема выступает. Описание значения как факта языковой компетенции диктует выбор в пользу семы, лотому что этим достигается более высокий уровень обобщения, что необходимо для описания системного значения слова.
Конкретизация семы в коммуникативном акте, таким образом, заключается в обусловленном коммуникативной задачей говорящего переходе от абстрактной семы к конкретной аллосеме в составе значения слова, т.е. в коммуникативном воплощении абстрактной семы в конкретной аллосеме. Конкретизация семы – процесс, сопровождающий ее актуализацию, но происходит он только с теми семами, которые имеют достаточно высокий уровень абстрактности, так как конкретные семы в конкретизации не нуждаются.
Поддержание семы – процесс, выражающийся в вербальной экспликации актуализируемой семы в коммуникативном акте. Эта экспликация выступает как средство контекстуального усиления семы и заключается в использовании в коммуникативном акте слова или словосочетания, эквивалентного отдельной актуализируемой семе или всему актуальному смыслу слова в целом. Экспликация может осуществляться как в микроконтексте (предложении), так и в макроконтексте (тексте в целом). В структурном отношении экспликация может быть как препозитивной, так и постпозитивной, в содержательном отношении – буквально эквивалентной актуальному смыслу слова или требовать перифраза. Например:
Хотелось мне быть храбрым, хладнокровным, одним словом, мужчиной (А. Генатулин. Атака). Поддерживаются семы «храбрый», «хладнокровный», экспликация носит буквальный характер.
– Мама всегда говорила, что ты трудный мальчишка. – Мальчишка! Я мужик теперь! Понимаешь, мужик! Я видел столько за эти месяцы, чего за сто лет не увидишь! (В. Кондратьев. Отпуск по ранению). Поддерживается сема «зрелый», «опытный», экспликация требует перифраза.
Взяли-таки с собой и «дегтярева», и автоматы. У меня и даже у всех ездовых новенькие ППШ и ППС. В случае чего море огня (А. Щербань. Варшавское шоссе). Поддерживается сема «большая огневая мощь», экспликация требует перифраза.
[Начальник охраны заповедника не пропускает с ружьем через территорию заповедника] – Так соболь же, валюта, – тянул начальник охраны. – С нас тоже требуют... (В. Чивилихин. Серебряные рельсы). Поддерживает семы «высокая ценность», экспликация "буквальна («валюта»).
Предлагаемая нами трактовка экспликации отличается от трактовки этого термина М.В. Никитиным, который под экспликацией понимает в широком смысле слова отражение в языке отношений вещи и признака – тигр-хищник, Москва есть Москва, гром гремит, снег белый, дом пустой и др. (1974, с. 209). В нашей интерпретации экспликация представляет собой вербальное дублирование актуализованных сем в акте речи. По мнению Е.И. Шейгал, придерживающейся близкой нам точки зрения, экспликация семантического компонента может осуществляться в целях подчеркивания, уточнения и квалификации компонента в речевой ситуации, а также для обеспечения связности текста (1981, с. 37). Особенно необходима поддержка экспликацией слабым периферийным семам, так как без нее эти семы зачастую требуют очень громоздкого контекста или вообще не могут актуализироваться и не будут понятны в акте речи. Например: Лошади – не коровы. Сена клок бросил, напоил – и все (Ф. Абрамов. Дом). Поддерживается актуализация периферийной семы «нетребовательность к пище». Обязательность экспликации семы при ее актуализации свидетельствует о ее слабости и периферийном характере.
Категоризация значения заключается в коммуникативно обусловленном выборе архисемы для актуализованного значения. В коммуникативном акте осуществляется категоризация предмета, которая отражается в выборе лексической единицы как средства номинации, а также в выборе архисемы в ее значении. Архисема выделяется как результат мыслительной операции категоризации, в результате чего значение относится,к определенному классу. Архисема выбирается из открытого ряда архисем, отложившихся в значении в результате прошлого опыта категоризации. Эти семы отражают различные уровни абстракций, на которых может осуществляться категоризация и выбор уровня (а, соответственно, и архисемы для значения) обусловлен коммуникативной ситуацией. Архисема выбирается в акте речи, но это не значит, что она наводится контекстом: архисема является внутренне присущим семантическим компонентом слова, выводимым из других компонентов в результате мыслительной операции, а не привносимым в значение со стороны.
Наведение семы – процесс коммуникативного внесения семы в значение. Наводятся семы, отсутствующие в системном значении слова. Наведенные семы относятся к разряду окказиональных. На возможность контекстуального наведения семантических компонентов указывал еще Г. Пауль, выделявший два типа окказионального употребления слова (1960, с. 101): когда окказиональное значение представляет собой часть узуального и когда оно содержит в себе и «нечто большее». И.В. Сентенберг (1975) подразделяет наводимые контекстом семы на два типа – «смысловые» и «эмоционально-экапресоивные коннотации». Подобное разделение весьма существенно, хотя во многих случаях отделить наведенные денотативные семы от коннота-тив:ных довольно трудно.
Денотативные семы наводятся в следующих примерах:
Наконец, к ночи определили в поездку по обмену опытом животноводов Кукушкина Л.Д. и Кулешова А.В. При Кукушкине и Кулешове послали непьющего агронома Василькову (В. Орлов. Альтист Данилов). Наводится сема «пьющие».
– Как же так? От воспаления легких [умерла]? – Скрытое было. На рентгене не видно. – Да, я знаю. Как же ее не просветили? Есть же техника! Алена стукнула кулачком по парте (Э. Пашнев. Белая ворона). Наводится сема «совершенная, эффективная».
А у твоего Салтыкова самое красное слово – дело. Он работник (В. Еременко. Слепой дождь). Наводится сема «надежный, ответственный».
Я научу вас мыслить, лентяи! – кричала она. Лицо ее становилось малиновым. – Я сделаю из вас математиков! (О. Астахова. Испанец Иванов). Наводится сема «знающий, квалифицированный».
Примеры наведения коннотативных сем:
– Быстрей, мужики! – Забегали! – обернулся Руцких. – У него кто хошь забегает, – отозвался Родион. – Агитатор! Старшой из него получится (В. Чивилихин. Елки-моталки). Наводится положительно-оценочная сема.
Сильва. ...Сердечно поздравляю, мы опоздали на электричку. Брр! Джентльмены! Провожание устроили! Обормоты! (А. Вампилов. Старший сын). Наведены презрительно-эмоциональная и неодобрительно-оценочная семы.
Наведение коннотативных «сем происходит в тех случаях, когда в структуре значения присутствуют автономные семантические признаки «эмоция» и «оценка»; поскольку данные признаки присутствуют в семантике всех неоценочных полнозначных слов (в оценочных словах есть соответствующие оценочные семы), то коннотативные семы могут быть факультативно наведены в значении любого такого слова – река, стол, дерево, шофер и т.д.
Существует разряд слов, в которых автономный признак «оценка» и «эмоция» предполагает обязательную контекстуальную конкретизацию, т.е. наведение того или иного кон-кретизатора в обязательном порядке. Л.И. Климова выделяет несколько семантических разрядов таких слов: слова, обозначающие степень признака с компонентом «чрезмерность» – гордый, дерзкий, хладнокровный и т.д.; слова с компонентом «действующий в неблагоприятных условиях» – хитрый, хитро, ловкий, ловко, изворотливый и др.; слова с компонентом «рассчитанный на внешний" эффект, показной» – красивый, нарядный, умник; существительные – названия животных или мифологических существ с актуализацией отдельных признаков – бес, черт, дьявол, собака, зубр; слова с суффиксами субъективной оценки – чистенький, глупенький, дурачок, жалконький, слабенький, добренький, улыбочка и др. Л. И. Климова (1975) подчеркивает, что ситуация и контекст полностью определяют ту или иную оце-но"чность таких единиц и эмоциональный заряд их (см. также Смоленская, Давыдов, 1972). В ряде примеров такого типа можно, видимо, говорить о наличии вероятностных коннотативных сем, например у слов с субъективно-оценочными суффиксами: в таких словах коммуникативный акт выявляет ту или иную вероятностную коннотативную сему, в остальных случаях коннотация наводится.
Денотативные и коннотативные семы могут наводиться в значении одновременно. Например:
[Речь идет о мертвом немецком генерале] Чего он приволокся, этот чужеземный генерал, в заснеженную Россию? Почему не принял капитуляцию? Стратег! (В. Астафьев. Где-то гремит война). Наводится денотативная сема «негодный, неумелый» и коннотативные неодобрительные семы.
[Прокурор осматривает место побега уголовников] Прокурор... осмотрел колючую проволоку на заборе, оставшуюся почти не тронутой, произнес в заключение только одно слово: «Специалисты!» – и пошел со двора (П. Нилин. Жестокость). Наведена денотативная сема «квалифицированные, умелые» и неодобрительная оценочная сема.
Наведению тех или иных сем могут способствовать определенные синтаксические конструкции. Так, положительно- оценочные семы наводятся в конструкциях типа она – хозяйка! он – мастер!; неодобрительные – в конструкциях типа тоже мне – муж! тоже мне – жизнь! В конструкциях же типа Вот это арбуз! Вот это специалист! могут наводиться как положительно-оценочные, так и неодобрительные семы. В конструкциях идут и идут, платят и платят, просят и просят наводится сема интенсивности. Синонимы в однородном синтаксическом ряду, если в этот ряд включено тематически инородное слово, часто наводят свою интегральную сему в значении этого слова:
Объявление. Фирма добрых услуг принимает заказы на организацию театрализованных представлений. Вы можете вызвать домой мифические персонажи: Деда Мороза, Снегурочку, Хозяйку Медной горы, мастера по ремонту холодильников (Лит. газ., 1983, 1 янв.). Наводится сема «мифический персонаж», которая поддерживается препозитивной вербальной экспликацией.
Наведение семы может быть неоднозначным: – Капитально! – крякнул Грек, не разобрать одобрительно, или нет (Ю. Мушкетик. Позиция). В таких случаях возможны две интерпретации: неясность актуального смысла может быть обусловлена неадекватностью контекста, либо может входить в коммуникативное намерение говорящего.
Укажем, что иногда нельзя провести четкой грани между наведением семы и актуализацией слабых периферийных сем значения. Возможно, что в области слабых периферийных сем мы имеем дело с пограничными между наведением и актуализацией сем случаями.
-- [ Страница 1 ] --
Н.И. ГЕНДИНА
ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ
АВТОМАТИЗИРОВАННЫХ БИБЛИОТЕЧНЫХ
СИСТЕМ
ОТ АВТОРА
В настоящее время стало очевидным, что традиционная технология обработки
документального потока, поступающего в библиотеки и службы информации, ручной
поиск, ручные процедуры производства библиотечно-библиографических продуктов и выполнения услуг делают слишком долгим путь информации к читателю, не обеспечивают необходимых условий для плодотворной работы ученых и специалистов, обращающихся в библиотеки. Потенциал ручной технологии практически исчерпан и не позволяет выйти на качественно иной уровень информационно-библиографического и библиотечного обслуживания потребителей информации.
Оптимальным способом решения проблемы является внедрение принципиально новых технологических процессов, базирующихся на применении ЭВМ. Внедрение вычислительной техники связано как с разработкой программного обеспечения, так и с созданием, ведением и эксплуатацией баз данных, содержащих различные виды информации, записанной на машиночитаемом носителе. Для того чтобы пополнять и корректировать такие базы данных, необходимо использование информационнопоисковых языков (ИПЯ), существующих в виде многочисленных классификационных схем, рубрикаторов, классификаторов, дескрипторных словарей, списков предметных рубрик и других лингвистических средств. Эта необходимость и послужила одной из причин подготовки данной книги, цель которой - оказать реальную помощь библиотечным и информационным работникам в овладении основами лингвистического обеспечения автоматизированных библиотечных систем.
В отличие от традиционной постановки вопроса, в рамках которой функционирование ИПЯ в библиотеках принято связывать лишь с систематизацией, предметизацией произведений печати и организацией библиотечных каталогов при ограниченности состава используемых языков (УДК, ББК, алфавитно-предметная классификация), здесь сделана попытка реализовать иной подход. Его особенность заключается в том, что ИПЯ рассматриваются с точки зрения их применения во всех сферах библиотечноинформационной технологии, поскольку эффективность функционирования библиотечноинформационных систем всецело зависит от качества, лингвистического обеспечения, т. е.
от комплекса используемых в системе ИПЯ.
Книга явилась результатом не только теоретического обобщения представленных в литературе сведений, но и экспериментальной проверки данных, реализованной в ходе многолетних научных исследований, проводимых на кафедре автоматизированных библиотечных систем и вычислительной техники Кемеровского государственного института культуры.
Материал книги рассчитан не столько на специалистов, получивших профессиональную подготовку в области информатики, средств автоматизации и программирования, сколько на лиц, имеющих гуманитарное образование и занятых в сфере библиотечно-информационной деятельности. Основываясь на результатах научных разработок и более чем десятилетнем опыте преподавания курса «Лингвистическое обеспечение автоматизированных библиотечных систем», автор адресует свою книгу библиотечным и информационным работникам - тем, от кого в первую очередь зависит качество комплектования документальных фондов, научной обработки литературы, эффективность справочно-библиографического и информационного обслуживания, обоснованность управленческих решений по оптимальной организации библиотечноинформационной технологии.
Г л а в а 1. СТРУКТУРА И НАЗНАЧЕНИЕ ИНФОРМАЦИОННО-ПОИСКОВОГО
ЯЗЫКА (ИПЯ)1.1. ИПЯ КАК РАЗНОВИДНОСТЬ ИСКУССТВЕННЫХ ЯЗЫКОВ
Языки, которые когда-либо использовались как средство общения в повседневной жизни человеческого общества, называются «естественными языками». Естественные - в том смысле, что они являются объективной реальностью, подобно биологическим видам или физическим компонентам материи. Можно изучать, описывать, анализировать естественные языки, но нельзя изменить их по своему произволу: естественные языки изменяются так же, как меняются биологические виды - путем эволюции.Естественный язык - это звуковой язык, созданный тем или иным народом в ходе многовековой общественной практики, являющийся средством общения, обмена мыслями и взаимного понимания в человеческом обществе. Важнейшими функциями естественного языка, таким образом, являются: 1) средство человеческого мышления; 2) средство коммуникации.
Помимо естественных языков существуют искусственные языки, сконструированные, специально изобретенные людьми для специфических видов коммуникации, для решения определенных задач в области науки, техники, культуры. Например, музыкальная партитура - это искусственный язык, с помощью которого композитор или аранжировщик доводит свое сочинение до музыкантов; исчисление предикатов - один из многих искусственных языков, изобретенных для использования в специальных разделах математики.
От обычного, естественного языка, возникшего стихийно и представляющего собой систему звуков и букв, такие искусственные языки отличаются тем, что они представляют собой систему знаков, все операции с которыми совершаются по формальным правилам.
Среди искусственных языков различают универсальные и специализированные Универсальные языки - это суррогаты (заменители) естественных языков, созданные для международного общения. К таким языкам относятся эсперанто, волапюк, идо, интерлингва, новиаль и некоторые другие. Наибольшую известность из них получил язык эсперанто, разработанный польским гуманистом доктором Л. Заменгофом, предложившим в 1887 г. свой проект международного языка. Сейчас на эсперанто выходит художественная и научная литература, издается свыше ста журналов, вещает восемнадцать радиостанций, в том числе и радио Москвы.
Специализированные искусственные языки - это особые знаковые системы для записи необходимой информации из определенных областей науки, техники, культуры. Среди них можно выделить такие языки, как азбука Морзе, язык музыкальной партитуры, средства стенографического письма, машинные языки, или языки программирования.
Последние представляют собой формальные языки, предназначенные для описания данных (информации) и алгоритмов (программ) их обработки на ЭВМ. Наибольшую известность из языков программирования получили ФОРТРАН, АЛГОЛ, КОБОЛ, БЭИСИК и целый ряд других.
К числу искусственных специализированных языков относятся информационнопоисковые языки, созданные для поиска информации.
Информационно-поисковый язык (ИПЯ)-это искусственный язык, предназначенный для выражения содержания документов или запросов или описания фактов с целью последующего поиска. Таким образом, основное назначение любого ИПЯ - обеспечить поиск информации, документальной или фактографической.
ИПЯ является важнейшим элементом информационно-поисковых систем (ИПС) и зачастую используются в качестве главной характеристики системы, так как именно от качества ИПЯ зависит достижение наилучших показателей поиска, таких, как полнота и точность. Однако и документы, и факты, и запросы, поступающие в информационнопоисковую систему, представлены с помощью естественного языка. Возникает вопрос:
какова необходимость использования в ИПС искусственного языка - ИПЯ? Почему нельзя воспользоваться для поиска информации естественным языком? Оказывается, что с точки зрения информационного поиска естественный язык обладает рядом недостатков, препятствующих отбору релевантных запросу сообщений (документов или фактов). К их числу относятся следующие:
1. Наличие в естественном языке слов, которые имеют небольшую смысловую нагрузку (союзы, предлоги, междометия), а также слов, которыми можно пренебречь при передаче содержания текста документа или запроса. Иными словами, речь идет об избыточности естественного языка, позволяющей сокращать объем какого-либо текста без значительного ущерба для его содержания.
Например, в сообщении Проблема повышения качества библиотечно-библиографического обслуживания является весьма актуальной, и решить ее можно только при широком использовании современных технических средств наиболее информативными, значимыми будут слова библиотечно-библиографическое обслуживание, качество, технические средства. Все мы учитываем это свойство естественного языка (избыточность), когда составляем текст телеграммы.
2. Наличие в естественном языке синонимов. С их помощью человек как бы расцвечивает свою речь, делает ее более выразительной, гибкой, достигает точности выражения мыслей, ее тончайших нюансов. Однако при проведении информационного поиска наличие синонимов снижает полноту выдачи информации по запросу. Так, вряд ли может быть достигнута приемлемая полнота выдачи, если человек, осуществляющий разыскание (библиотекарь-библиограф, информационный работник), не знает, что лазер и оптический квантовый генератор, шафран и крокус, авадекс и диаллат - это словасинонимы. Точно так же при неустраненной синонимии будет страдать качество выданной информации и в автоматизированной информационно-поисковой системе.
При обеспечении качественного информационного поиска особое значение имеет устранение лексической, логической и синтаксической синонимии.
Лексические синонимы - это, как правило, слова и словосочетания, выступающие в роли взаимозаменяемых элементов высказывания: динамо машины - электрогенераторы постоянного тока, перегной - гумус, токсины - яды. К. лексическим синонимам относятся также полное наименование предмета, процесса, свойства и его аббревиатура (сокращенное наименование): избирательное распространение информации - ИРИ, ракеты средней дальности - PCД.
Логические синонимы возникают при логическом определении понятий: Мнемозина - богиня памяти в греческой мифологии, мать девяти муз; Ассюре - типографическая линейка, дающая оттиск в виде нескольких параллельных линий; Семиотика - наука о знаках и знаковых системах.
Синтаксические синонимы представляют собой синонимичные синтаксические конструкции, отражающие возможность естественного языка выразить одну и ту же мысль различными речевыми оборотами, т. е. перефразировать: плавание под водой - подводное плавание, план на квартал - квартальный план, бумага для письма - писчая бумага С точки зрения создания ИПЯ, обеспечивающего высокое качество информационного поиска, важное значение имеет объединение слов-синонимов или синонимичных конструкций в синонимические ряды (классы условной эквивалентности).
3. Наличие в естественном языке полисемичных (многозначных) слов. Так, слово адрес может означать: а) местожительство определенного лица или местонахождение учреждения, предприятия и т. п.; б) обозначение местожительства или местонахождения получателя на почтовом отправлении; в) письменное приветствие, поздравление какому-либо лицу, учреждению по случаю юбилея; г) код, определяющий местоположение информации в ЭВМ.
4. Наличие в естественном языке слов-омонимов, т. е. слов, которые звучат и пишутся одинаково, но по смыслу не имеют ничего общего, например: линь (вид рыбы) и линь (вид каната), бум (шумиха, искусственное оживление вокруг чего-либо) и бум (спортивный снаряд), рысь (млекопитающее рода кошек) и рысь (вид поступательного движения лошади).
Полисемичные слова отличаются от омонимов тем, что сохраняют некоторую общность значений у разных по смыслу слов, омонимы же такой общности значений не имеют. И если в естественном языке полисемия и омонимия - суть проявления его богатства и выразительной мощи, то при проведении информационного поиска они являются существенным тормозом. Неустраненные омонимия и полисемия не только затрудняют поиск информации, но и приводят к снижению качества выдаваемой информации, к так называемому «информационному шуму». Например, лишенные контекста слова гусеница, сыворотка, соединение, операция, заговор и т. п. трудно отнести к какой-либо тематической области поиска и, значит, гарантировать точность выдаваемой информации.
Таким образом, для проведения качественного отбора релевантных документов (фактов) в ответ на запрос были созданы специальные искусственные языки - ИПЯ, отвечающие специфическим требованиям, предъявляемым к ним информационно-поисковыми системами.
Перечислим их.
1. Однозначность: каждая запись на ИПЯ должна иметь только один смысл; и, наоборот, любой смысл должен получать единообразное представление на ИПЯ.
Следовательно, ИПЯ должен устранять такие явления естественного языка, как полисемия, омонимия, синонимия.
2. Эксплицитное (явное) выражение полезных для поиска смысловых отношений между словами (логических отношений и психологических ассоциаций). Реализация этого требования делает ИПЯ своего рода справочником, схемой-путеводителем, позволяющим библиотекарю легко ориентироваться в конкретной отрасли знаний, устанавливать виды связей и взаимодействия между отдельными (отраслях) понятиями.
3. Возможность корректировки и пополнения ИПЯ, его «гостеприимство». Иначе говоря, ИПЯ должен быть гибким, обладать способностью включать новые понятия без коренной ломки принятой структуры.
4. Удобство пользования, предполагающее мнемоничность - удобство для запоминания записей на ИПЯ, а также компактность.
5. Семантическая сила ИПЯ (выразительность, селективная мощность), т. е. способность языка идентифицировать предмет, различать его мелкие особенности, а также описывать его с разной степенью детализации. Семантическая сила ИПЯ тем больше, чем богаче его словарный состав и шире его словообразовательные возможности, чем более четко дифференцированы смысловые отношения между его словами, чем более развита система синтаксических отношений между словами этого языка.
Основными структурными составляющими любого ИПЯ являются алфавит, лексика, грамматика, парадигматические и синтагматические отношения.
Алфавит ИПЯ может включать в свой состав буквы алфавита какого-либо естественного языка (латинского, кириллического и др.), арабские и римские цифры, знаки пунктуации (точка, запятая, двоеточие, кавычки, дефис, круглые и квадратные скобки, апостроф), знаки арифметических операций (плюс, минус, косая черта, знак процента), знаки отношений (больше, меньше, равно), операторы булевой алгебры (знаки конъюнкции, дизъюнкции, отрицания), специальные знаки и символы, например: стрелки, двойное двоеточие, квадрат, знак конгруэнтности и т. д.
Алфавит ИПЯ может быть представлен только цифрами, например УДК, Рубрикатор ГАСНТИ, или только буквами, базируясь на алфавите какого-либо естественного языка, например, язык предметных рубрик, дескрипторный язык, язык библиографических описаний и некоторые другие ИПЯ. Кроме того, алфавит ИПЯ может быть смешанным, буквенно-цифровым. На буквенно-цифровом алфавите основаны фасетная классификация, язык RX-кодов, СИНТОЛ, семантический код Перри - Кента и др.
Лексика, или словарный состав, ИПЯ - это совокупность всех лексических единиц, которыми он оперирует. Лексическая единица - это последовательность букв, цифр, специальных символов, принятая для обозначения какого-либо понятия. Таким образом, лексическая единица ИПЯ представляет собой единство плана содержания и плана выражения. В ней органически слиты две стороны - форма и значение.
Лексические единицы в каждом ИПЯ имеют разные названия: в дескрипторном языке - дескрипторы, в языке предметных рубрик (алфавитно-предметной классификации)- предметные рубрики, в фасетной классификации - изолаты, в УДК, ББК, рубрикаторах - индексы и соответствующие им словесные формулировки.
В таких ИПЯ, как язык унитерм, язык ключевых слов, язык предметных рубрик, дескрипторный ИПЯ, план выражения и план содержания лексической единицы будут совпадать, так как эти ИПЯ базируются на алфавите и лексике естественных языков. В ИПЯ классификационного типа, например УДК, ББК, Международной классификации изобретений и т. п., план выражения и план содержания не будут совпадать. Например, в УДК:
План выражения План содержания 634. Анализ лексики любого ИПЯ можно осуществлять, используя три параметра: способ задания лексики, уровень интеграции лексики и способ построения лексических единиц.
неконтролируемой лексикой. В ИПЯ с контролируемой лексикой все лексические единицы учитываются в специальном словаре. В качестве таких словарей выступают, например, таблицы классификации УДК и ББК, рубрикаторы, дескрипторные словари и тезаурусы, словари предметных рубрик и тому подобные пособия. В ИПЯ с неконтролируемой лексикой таких пособий нет. В них используется естественный язык, применение которого ограничено (формализовано) введением специальных правил.
Примером использования ИПЯ с неконтролируемой лексикой служат информационнопоисковые системы, основанные на так называемом «бестезаурусном» вводе информации, например ИПЯ системы «Кристалл».
В отличие от естественного языка, в качестве лексической единицы ИПЯ может выступать не только отдельное слово, но и устойчивое словосочетание, а также фраза, предложение. В соответствии с этим различают уровни интеграции.
К первому уровню интеграции относятся ИПЯ, лексическими единицами которых являются преимущественно единичные слова и устойчивые словосочетания, например:
бетон, индикаторы, квантовая механика, каменный уголь. К числу ИПЯ, характеризующихся лексикой первого уровня интеграции, относятся языки типа «Унитерм», дескрипторные ИПЯ, фасетные классификации.
Вторым уровнем интеграции лексики характеризуются те ИПЯ, лексическими единицами в которых выступают не только отдельные слова и словосочетания, но и фразы, имеющие сложную синтаксическую структуру. На этом уровне находится лексика ИПЯ иерархических классификаций, таких, как УДК, ББК, Рубрикатор ГАСНТИ, Международная классификация изобретений (МКИ), и некоторых других. Например:
641.4 Консервирование продуктов в домашних условиях (УДК); А 44 С 27/00 Изготовление ювелирных изделий (МК.И).
Появление лексических единиц второго уровня интеграции в иерархических классификациях обусловлено тем, что выражение «узких» понятий, стоящих на нижних ступенях иерархии, требует сложных синтаксических конструкций естественного языка. К аналогичным случаям приводит практика использования «узкой рубрики» при предметизации.
Построение лексических единиц ИПЯ может осуществляться двумя способами:
1) использованием в качестве лексических единиц специальных кодов, например в УДК, ББК, Рубрикаторе ГАСНТИ и др.;
2) использованием в качестве лексических единиц слов и словосочетаний естественного языка, например: язык типа «Унитерм», дескрипторные ИПЯ, язык библиографического описания, язык предметных рубрик.
В соответствии с этим различают словарные и кодированные ИПЯ. Словарные ИПЯ - это языки, в которых план содержания совпадает с планом выражения естественного языка. Поэтому для лексических единиц этого типа ИПЯ не требуется перевод на естественный язык. Таковы язык предметных рубрик и дескрипторный язык.
Кодированные ИПЯ - это языки, в которых план выражения не совпадает с планом содержания. В этих случаях создаются специальные двуязычные словари, позволяющие коды ИПЯ переводить на естественный язык и обратно. Примером таких языков служат ББК, УДК и другие классификации, рубрикаторы.
Термины - основа лексики ИПЯ. Независимо от способа контроля лексики, уровня ее интеграции и способа построения лексических единиц в основе лексики любого ИПЯ лежат термины, так как они являются основными носителями научно-технической информации в текстах документов и запросов. Термины представляют собой наиболее существенный «строительный материал», при помощи которого создается ИПЯ. Поэтому без знания закономерностей образования терминологии, источников ее формирования, структурных особенностей терминов невозможно разработать ни словарь предметных рубрик, ни классификатор, ни информационно-поисковый тезаурус, ни любой другой ИПЯ.
Знание механизмов появления и функционирования терминов в научно-технических текстах позволяет качественно улучшить подготовку поисковых образов документов и поисковых предписаний, совершенствуя тем самым процедуру индексирования.
Поскольку единой системы классификации терминов в настоящее время нет, воспользуемся различными основаниями деления, для того чтобы дать многоаспектную характеристику терминологии как основы лексики любого ИПЯ. Основными признаками, позволяющими охарактеризовать термины, являются: структурные типы терминов, грамматическая структура терминов, деление терминов в зависимости от семантических процессов, сферы употребления, источников формирования.
С т р у к т у р н ы е т и п ы т е р м и н о в. Все термины в зависимости от языковых средств выражения можно разделить на две группы: языковые и неязыковые.
Языковые термины включают в свой состав термины-слова, термины-словосочетания и термины-предложения.
Термины-слова подразделяются на непроизводные: газ, лак, информация; производные:
газовый, лаковый, информационный; сложные: газоносный, лако-красочный, информационнопоисковый; аббревиатуры: ДНК, МБА, ЭВМ.
Термины-словосочетания включают свободные словосочетания, в которых каждый из компонентов - термин и может вступать в двустороннюю связь: квантовая химия, физическая химия, квантовая биология, библиотечная система, библиотечная статистика;
несвободные словосочетания, в которых компоненты, взятые изолированно, могут быть и не терминами, и лишь в сочетании друг с другом они образуют термин: библиотечный почерк, авторский лист, белый стих, читальный зал, черный ящик; терминыфразеологизмы, т. е. устойчивые, неделимые словосочетания: роза ветров, роза волнений, кошачьи лапки (морские термины); кошачье золото, кошачье серебро (геологические термины); кармашек книги, ключ к систематическому каталогу, источник информации, информационный шум (библиотечно-информационные термины).
Термины-предложения чаще всего представляют собой военные, морские, спортивные команды, например: Весла за борт!; Вперед смотреть!; На плечо! и т. п.
Неязыковые термины представлены специальными знаками, графическими символами.
Главная особенность неязыковых средств выражения терминов заключается в их абсолютной условности, искусственности, сознательной закрепленности за понятием.
Широкое применение в этих целях нашли символы, используемые в составе сложных, специальных наименований - комбинированные символослова: V-образные соединения, Хобразные соединения. В качестве неязыковых средств часто используются буквы греческого алфавита, например в терминологии физики элементарных частиц: a-частица, a-распад, bрадиоактивность и т. п.
Грамматическая с т р ук т ур а терминов. Экспериментальные исследования терминологии показывают, что наиболее типичными моделями образования терминов являются следующие: прилагательное+существительное (библиотечные каталоги, жаропрочные сплавы); 2) существительное+существительное (комплектование фондов, катушки индуктивности); прилага-тельное+прилагательное-1-существительное (интегральные информационные системы, дуговые пламенные лампы). Активное использование в качестве терминов таких частей речи, как существительное и прилагательное, "объясняется тем, что именно они способны назвать, выразить понятие, в отличие от лексических единиц, которые лишь указывают на предмет, но не дают ему индивидуального имени: над, он, тот, эта и т. п.
общелитературной лексике: полисемия, омонимия, синонимия, антонимия.
О полисемии (многозначности) мы говорим тогда, когда один термин имеет два и более значений. Например, термин давление применяется как для обозначения процесса, так и силы, действующей на поверхность. Существует несколько причин появления полисемии терминов: а) ограниченность словарного состава по сравнению с количеством понятий; б) сосуществование понятий, относящихся к одному явлению, но отражающему различные взгляды, гипотезы; в) неправильное заимствование терминов из иностранных языков и др.
Омонимия в терминологии представлена одной своей разновидностью - межнаучной терминологической омонимией, когда за одинаковыми терминами закреплены разные дефиниции (определения). Эти термины функционируют в разных терминологических системах. Например, употребление термина реакция свойственно таким отраслям, как химия, физика, политика, термин операция используется в медицине и военном деле.
Разграничить полисемию и омонимию бывает сложно, особенно в тех случаях, когда в качестве слов-терминов используются слова общелитературного языка в переносном значении. Например, сухарь в технике - это «простая вспомогательная промежуточная деталь в механизмах и узлах машин», мода (в математике) - «наиболее часто встречающееся значение в варьирующем ряду» и т. д.
Синонимия. В терминологии синонимы соотносятся с одним и тем же понятием и объектом, поэтому их иногда называют терминологическими дублетами. Причинами и источниками возникновения синонимов в терминологии являются: а) параллельное употребление отечественных и международных или заимствованных наименований:
экслибрискнижный знак, издание=многотомник, коэффициент полезного действия = кпд; в) параллельное употребление так называемых фамильных терминов и их вариантов, созданных на основе классификационного признака понятия: Джонсон-эффект= тепловой эффект, булева алгебра = алгебра логики; г) двойное обозначение понятия в физике, химии и некоторых других науках, словесное и символическое: Н2SО4= серная кислота, 1=температура; д) использование разных наименований объекта в зависимости от рассматриваемой точки зрения, сферы его функционирования. Например, в зависимости от сферы употребления один и тот же объект может иметь торговое, техническое и химическое название:
лавсан= терепласт= полиэтилентерефталат.
Характерно, что синонимия особенно присуща ранним этапам формирования терминологической системы, когда еще не произошел отбор лучшего термина из нескольких предложенных.
Антонимия в терминологии проявляется в наличии противоположных научных понятий. Для их выражения широко используются словообразовательные средства:
чередование приставок (релевантный - нерелевантный, обратимый - необратимый), использование приставок полярного значения (макродокумент - микродокумент, предкоординатный - посткоординатный).
В зависимости от с ф е р ы у п о т р е б л е н и я термины могут подразделяться на научные, технические, военные, юридические и пр. При этом в пределах каждой предметной области могут быть выделены специальные (базисные) термины, характерные только для данной сферы; общенаучные термины, отражающие методы, процедуры, средства познания любой предметной области; «привлеченные» термины смежных областей знания, обозначающие необходимые для данной предметной области понятия из смежных отраслей науки и техники. Все эти совокупности терминов находятся во взаимосвязи и не имеют четких границ.
собой разные виды заимствований.
1. Заимствование элементов классических языков (корней или морфем греческого или латинского языков). Принятые в качестве международных, эти термины наиболее целесообразны. Их легче оградить от полисемии, так как большинство таких терминов однозначно выражают определенные значения: микро-, макро-, -граф-, поли-, -логия, анти-, супер-, -трон, -дром и т. п. Они не вызывают ложных ассоциаций, так как не мотивируют терминологические наименования, а расшифровывают именуемые понятия посредством значений составляющих их терминоэлементов, например: микрофильм, экслибрис, монография, этнография, лимнология и т. п.
2. Заимствования из других языков. Они являются неизбежными не только для терминологии, но и для языков вообще, так как ни один естественный язык не может развиваться изолированно. Например, для музыкальной терминологии характерны заимствования из итальянского языка (кантата, дуэт, тенор); военной - из французского (батальон, атака, десант); в терминологии техники и спорта немало английских слов (экскаватор, рельс, туннель, блюминг, финиш, рекорд, ринг, нокаут) и т.
п. Значительное количество терминов информатики также заимствовано из английского языка (компьютер, файл, дескриптор, релевантность).
3. Заимствование из литературного языка. Например: усталость - состояние металла, находящегося под многократным воздействием нагрузок; общение с ЭВМ;
информационный шум и т. п.
1.3. ПАРАДИГМАТИЧЕСКИЕ И СИНТАГМАТИЧЕСКИЕ ОТНОШЕНИЯ В ИПЯ
Между лексическими единицами любого ИПЯ, как и между словами естественного языка, существуют определенные отношения, которые обусловлены наличием логических связей между предметами и явлениями, обозначенными этими словами. Такие отношения отражают смысловую связь между понятиями, показывают объективные предметнологические зависимости между явлениями внешнего мира. Они носят внетекстовой характер и поэтому не зависят от ситуаций, для описания которых используются слова.Например, слова акварель, фреска, темпера связаны друг с другом отношением соподчинения или координации, так как они обозначают понятия, входящие в более широкий класс - живопись. Между словами живопись и акварель, азот, аммиак, водород и газы существует отношение «род-вид», слова платье и рукав, здание и крыша связывает отношение «целое-часть», а между словами загрязнение окружающей среды и нарушение экологического равновесия существуют отношения причинно-следственного характера. Все эти примеры иллюстрируют парадигматические (аналитические, базисные, имманентные) отношения, обусловленные наличием не языковых, а логических связей между предметами и явлениями. Парадигматические отношения отражают, таким образом, логические отношения и психологические ассоциации между значениями лексических единиц ИПЯ.
Важнейшими свойствами парадигматических отношений являются:
контекста, т. е. независимость от ситуации, в которой лексические единицы употребляются. Так, слово карась неизменно вызывает представление о рыбе, а лексические единицы яблоки, апельсины всегда ассоциируются с понятием «фрукты»;
2) многоступенчатость, нелинейность парадигматических отношений: одна и та же лексическая единица может входить в состав различных парадигм, т. е. в различные смысловые ряды, в которых она противопоставляется по различным смысловым признакам. Например:
Река - ручей - речка (размеры водоема) Река - пролив - озеро - море (форма водоема) Река - канал - пруд - водохранилище (характер происхождения водоема).
Свойство многоступенчатости, нелинейности парадигматических отношений особенно заметно проявляется при разработке ИПЯ на этапе систематизации, упорядочения лексики, при построении классификационных схем понятий, когда возникает необходимость отнесения той или иной лексической единицы к различным смысловым рядам (парадигмам).
Принято различать сильные и слабые парадигматические отношения, связывая эти понятия с той ролью, которую эти отношения выполняют для реализации информационного поиска.
Сильные парадигматические отношения включают в свой состав отношения тождества и отношения иерархии.
Отношения тождества (совпадения, адекватности) как разновидность сильных парадигматических отношений выражаются в использовании синонимов. Учет отношений тождества, синонимии при проведении информационного поиска имеет принципиально важное значение: неустраненная синонимия, как уже отмечалось, ведет к ощутимым потерям при поиске, снижает полноту выдачи информации по запросу. Например, вряд ли будет обеспечена полнота ответа на запрос, если человек, ведущий поиск, не знает, что альтернаторы - это то же самое, что и генераторы электрические, а карболиты и фенопласты, метаболизм и обмен веществ - есть равнозначные понятия.
Отношения иерархии как разновидность сильных парадигматических отношений соответствуют отношениям подчинения или отношениям типа «выше-ниже». В пределах иерархических отношений различают отношения типа «род-вид» и «целое- часть».
Отношение «род-вид» является одним из важнейших видов связей между понятиями.
При этом родовым (подчиняющим) называется понятие, выражающее существенные признаки класса предметов, являющихся видами этого рода. Соответственно видовым (подчиненным) называется понятие, которое отображает существенные признаки класса предметов, являющегося видом какого-либо рода.
Связь видового и родового понятия отображает ту реальную связь, которая существует между родом и видом в природе и обществе. Например, понятия лошадь, корова, овца - видовые понятия, в которых выражены существенные признаки отдельных, качественно особенных, но взаимосвязанных форм животных, входящих в одно родовое понятие домашние животные.
Одно и то же понятие может быть (за исключением единичных понятий и предельно общих категорий типа материя, движение, пространство и т. п.) как видовым, так и родовым одновременно в зависимости от того, по отношению к какому понятию оно рассматривается. Например, понятие аннотация является видовым по отношению к понятию вторичные документы и родовым по отношению к понятию справочная аннотация.
Основным условием для установления иерархических отношений типа «род-вид»
является соблюдение требования: «Все, что можно сказать о роде, можно сказать о виде».
Родовое понятие при этом нельзя рассматривать как сумму более узких видовых понятий.
Нельзя сказать, например, что стали - это сумма таких понятий, как сталь высокопрочная, сталь легированная, сталь углеродистая и т. д. Несоблюдение этого условия часто приводит к смешению двух типов сильных парадигматических отношений:
«род-вид» и «целое-часть»1.
Отношение «целое-часть» отражает реальный факт вхождения одного объекта подчиненными в результате разложения целого на части.
В отличие от родо-видовых отношений при установлении связей типа «целое-часть»
не действует закономерность: «Все, что можно сказать о подчиняющем понятии, можно сказать о подчиненном понятии». Кроме того, понятия, выражающие части целого, не находятся между собой в отношении соподчинения, что является характерным признаком видовых понятий.
Значение для информационного поиска сильных парадигматических отношений иерархического характера («род - вид» и «целое -часть») вполне очевидно. Родовидовые 1 По поводу отнесения связи типа «целое - часть» к сильным парадигматическим отношениям в специальной литературе не существует единства. Зачастую этот вид связи рассматривается в рамках слабых, ассоциативных парадигматических отношений.
отношения, эксплицитно представленные в ИПЯ, позволяют существенно корректировать стратегию поиска по запросам в зависимости от результатов выдачи. В случае «нулевой»
или недостаточной выдачи информации по запросу привлечение родовых, вышестоящих терминов позволит расширить область поиска, повысив при этом полноту выдачи. Если же по результатам поиска выдана избыточная информация, корректировку поискового предписания можно осуществить на основе введения видовых, нижестоящих понятий, что дает возможность значительно сузить область поиска и повысить точность выдаваемой информации.
Точно так же может происходить корректировка стратегии поиска и с учетом парадигматических отношений типа «целое - часть», так как вполне вероятно, что для потребителя информации, интересующегося системой, механизмом, аппаратом, процессом в целом, может оказаться полезной информация и об их составных частях, элементах, деталях, операциях.
Слабые (ассоциативные) парадигматические отношения учитывают логические отношения пересечения понятий и различные психологические ассоциации.
Психологические ассоциации возникают в сознании человека, когда представление об одном предмете (процессе или явлении) вызывает у него представление о предметах (процессах, явлениях), связанных с первым по какому-либо существенному признаку.
Ассоциативные отношения в лексике связаны с понятием мотивированности. Они всегда характеризуют совместное участие соответствующих объектов в типичной для данной области ситуации или участие объектов в аналогичных ситуациях.
причислять отношения причины - следствия, смежности, контраста, кратности.
Отношения типа «причина-следствие» характеризует такую ситуацию, при которой одно явление, действие (причина) вызывает, определяет, изменяет или влечет за собой другое явление - следствие. Это отношение связывает лексические единицы, обозначающие соответственно причину и следствие: авария-травма, нарушение технологии - брак, шум - звукоизоляция.
противопоставления предметов, процессов не по критерию их общности, а по критерию различия. Оно выражается в лексике ИПЯ с помощью антонимов, противоположных по значению слов: экспорт-импорт, полнота-потери, блокирование-деблокирование, контактное реле - бесконтактное реле.
Помимо антонимов отношения противоположности, контраста в лексике могут быть реализованы с помощью омонимов: ассоциация (психологическая) и ассоциация (объединение), заговор (политика) и заговор (фольклор).
Отношение смежности является отражением в сознании ассоциативной связи между предметами или явлениями, которые воспринимаются в непосредственной близости друг другу в пространстве и во времени: болото-торф, ток электрический - напряжение, пастбища - травы многолетние.
Отношение кратности - особый вид связи, существующей в категориях единиц измерения величин. Так, нельзя сказать, что километр есть понятие более широкое, чем метр, а сантиметр - более узкое, чем метр. Одно из них является основным, а другое - производным, т. е. кратным.
Рассмотренные нами как сильные, так и слабые парадигматические отношения имеют принципиально важное значение для правильного выбора и точного употребления всех лексических единиц, которые требуются для передачи какого-либо сообщения, в том числе и для подготовки поискового образа документа и поискового предписания. Без учета парадигматических отношений: невозможно правильно провести информационный поиск по запросу, осуществить качественное индексирование, аннотирование или: реферирование документа, подготовить обзор литературы. Решающее значение установление парадигматических отношений между лексическими единицами имеет при разработке ИПЯ. Для этого необходимо знание основных способов выявления парадигматических отношений.
Существующие способы установления парадигматических отношений можно условно разделить на две группы: логико-интуитивные и формализованные.
Логико - интуитивный способ установления парадигматических отношений направлен на выявление существенных смысловых связей между понятиями.
Достижению этой цели обычно служат следующие пути.
1. Анализ реальных научно-технических текстов как первичных, так и вторичных документов. Он позволяет вскрыть реальные типы смысловых отношений, характерных для данных текстов, заранее устранить искусственное и надуманное их конструирование в отрыве от самих текстов. При таком подходе парадигматические отношения, введенные в ИПЯ, будут соответствовать смысловым отношениям, существующим в текстах документов соответствующей отрасли знания.
2. Установление парадигматических отношений через обращение к энциклопедиям, терминологическим словарям, обобщающим справочникам в данной области. Этот путь основывается на анализе логического описания и определения терминов. В словарных статьях справочных изданий обычно четко указываются все подвиды объекта, его назначение, сфера применения, местонахождение, основные количественные характеристики и параметры.
3. Обращение к специалистам в данной отрасли знания, предполагающее корректировку намеченных ранее парадигматических отношений.
На практике обычно используются одновременно все три способа выявления парадигматических отношений.
Формализованный способ базируется на следующих средствах «опознания»
(различения) парадигматических отношений в тексте: лексических (использование глаголов, причастий, вводных слов, предлогов и т. п.); пунктуационных (использование двоеточия, тире, скобок и т. п.); использование схем, чертежей; использование различий в шрифтах (курсив, разрядка).
Так, целям распознавания сильных (родо-видовых) парадигматических отношений служат такие лексические единицы, как разновидность, подразделяются на, различают, делят на, в виде, относится к классу и т. п. Например: «В комплексе лингвистического обеспечения ИПС принято различать классификационные и дескрипторные ИПЯ»;
«Натуральный каучук относится к классу природных полимеров»; «Разновидностью вторичных документов являются рефераты».
Распознаванию сильных парадигматических отношений способствуют предлоги из, среди, с и вводные слова типа в частности, как правило, в первую очередь: «Среди информационно-поисковых систем можно выделить документальные и фактографические»; «Из числа изделий платьевых можно назвать платье-костюм, платьепальто, платье-сарафан»; «В первую очередь из однолетних бобовых трав надо указать на вику, донник, люпин».
Немаловажное значение для установления сильных парадигматических отношений имеют знаки пунктуации - двоеточие, тире: «Непрерывные носители информации:
магнитные ленты, магнитные диски, магнитные барабаны»; «Основные лесоматериалы - бревна, доски, фанера».
Установлению парадигматических отношений типа «целое- часть» способствуют схемы и чертежи, наглядно представляющие составные части предмета, объекта.
Лексическими распознавателями для этого вида отношений могут служить словосочетания типа: состоящий из, изготовленный из, в состав входят, являются частью. Например: «Рубрикатор ГАСНТИ является частью лингвистического обеспечения системы»; «В состав препарата «Каметон» входят хлоробутанолгидрат, камфара, ментол».
Распознаванию слабых парадигматических отношений типа «предмет - назначение»
служат следующие лексические средства: используется для, предназначен для, служит для, в целях. Например: «ИПЯ служит для индексирования документов и запросов»;
«Термокопировальный аппарат предназначен для тиражирования листового материала».
Использование формализованного способа позволяет снизить субъективизм при установлении смысловых связей между лексическими единицами сложных, насыщенных отраслевой терминологией научно-технических текстов. Его использование целесообразно сочетать с логико-интуитивным методом.
Помимо парадигматических отношений, связывающих слова любого языка по смыслу, в нем имеются также и линейные отношения, устанавливаемые непосредственно при объединении слов и словосочетаний во фразы (предложения). Такие отношения получили название синтагматических. В специальной литературе их называют также синтаксическими, грамматическими, ситуативными, контекстуальными.
Для понимания природы и назначения синтагматических отношений в ИПЯ принципиально важно то, что они устанавливаются при использовании лексических единиц. В отличие от парадигматических, синтагматические отношения проявляются лишь при употреблении лексических единиц и целиком зависят от контекста.
Следовательно, они всегда характеризуют момент реального взаимодействия лексических единиц. Применительно к ИПЯ употребление лексических единиц происходит при индексировании - построении ПОД или ПП. Именно на этом этапе приводятся в движение лексические единицы ИПЯ и используется его словарный состав.
Синтагматические отношения - это всегда отношения между лексическими единицами в линейно-упорядоченных цепочках. Как только мы приводим в действие механизм синтагматических отношений, всегда образуется лексическая единица более высокого уровня интеграции: от слова - к словосочетанию, от простой предметной рубрики - к сложной, от простого индекса классификации - к составному и т. п.
Известно, что парадигматические отношения, характеризуя смысловые, семантические связи между понятиями, носят постоянный характер, например: Сосна - это разновидность хвойных деревьев; Кроссовки - вид обуви и т. д. В то же время одни и те же лексические единицы могут образовывать различные выражения и передавать совершенно различные (а то и прямо противоположные) значения, например:
производство нефти и очистка бензина и производство бензина и очистка нефти;
политика силы и сила политики, перестройка пропаганды и пропаганда перестройки.
Таким образом, не имеющее ограничений словоупотребление, «вышедшая из под контроля» лексика может привести к появлению ложных словосочетаний и выражений с искаженным смыслом. В результате лексические единицы в ПОДе могут вступать в ложные словосочетания. При выдаче информации в ответ на запрос это оборачивается «информационным шумом», нерелевантными документами.
Для того чтобы избежать подобных негативных явлений и повысить точность информационного поиска, в ИПЯ предусмотрено использование специальных синтагматических отношений.
Грамматика ИПЯ - это конкретный набор средств и правил построения поисковых образов на данном ИПЯ. В пределах грамматики одного ИПЯ могут быть использованы различные грамматические средства.
1. Мешочная грамматика. Это простое перечисление лексических единиц, входящих в один ПОД или ПП. В этом случае сам факт присутствия данного набора лексических единиц свидетельствует о существовании текстуальной связи между ними, и эта «связь может быть более или менее однозначно выявлена, исходя из значения перечисленных лексических единиц. Мешочная грамматика часто используется в отраслевых или узкотематических ИПС дескрипторного типа технической тематики. Языки, применяющие мешочную грамматику, иногда называют также «ИПЯ без грамматики», понимая под этим минимальность используемых грамматических средств. В иерархических библиотечно-библиографических классификациях используется знак «плюс» для соединения понятий, сошедшихся в одном тексте (документа или запроса).
Характер отношений при этом не фиксируется. Знак «плюс» фактически выполняет роль оператора мешочной грамматики, поскольку показывает совместное вхождение лексических единиц в один поисковый образ без указания их смысловых отношений друг к другу.
Примером ИПЯ, реализующих мешочную грамматику, являются языки типа «Унитерм», разрабатываемые для узкоотраслевых и тематических ИПС, обслуживающих небольшие специализированные массивы объемом до 30 тыс. документов.
Приведем пример реализации мешочной грамматики, когда простое перечисление слов, извлеченных из текста документа, дает представление о нем и образует его поисковый образ:
Важно подчеркнуть, что порядок следования лексических единиц в ПОДе или ПП при использовании мешочной грамматики не имеет никакого значения и носит произвольный характер.
2. Позиционная грамматика. Это установление жесткого порядка следования лексических единиц, входящих в один поисковый образ. В ИПЯ классификационного типа (УДК, ББК) позиционная грамматика проявляется в правилах построения сложного индекса, согласно которому на первое место всегда ставится индекс, взятый из основных таблиц классификации, а затем индекс, содержащийся во вспомогательных таблицах.
К разновидностям позиционной грамматики следует отнести анкетный (аспектный, формулярный, матричный) способ составления поисковых образов и метод «стандартных фраз». Смысл первого способа можно охарактеризовать следующим образом. При создании ПОД или ПП вводится единая фиксированная схема (анкета, формуляр, матрица) упорядочения лексических единиц, определяющая порядок их записи. В этом случае перевод слов на ИПЯ, т. е. индексирование сводится к размещению в необходимые зоны соответствующих лексических единиц. Если какие-либо сведения в документе или запросе отсутствуют, то в соответствующей позиции ставится прочерк. Иными словами, индексирование на основе этого способа сводится к заполнению позиций анкеты, матрицы, формуляра и т. п.
Такой способ составления поисковых образов определяется однотипной структурой текстов, подлежащих индексированию. Например, для унификации и индексирования научно-технических текстов наиболее часто используется следующая схема анализа:
1. Предмет или тема исследования.
2. Область применения или использования предмета.
3. Метод исследования.
4. Условия, в которых протекало исследование.
5. Технические средства или оборудование, применявшиеся в ходе исследования.
6. Результаты исследования.
Преимуществами рассмотренного способа являются компактность записи, удобство сопоставления выражений на ИПЯ при Поиске, снижение субъективизма индексатора.
Однако при большом разнообразии информации, заключенной в текстах, данный способ теряет свои преимущества, так как многие позиции анкеты остаются незаполненными (они либо не имеют смысла для данного объекта, либо вообще отсутствуют). Данный способ может оказаться неудобным, если анкета будет слишком громоздкой.
Метод «стандартных фраз». «Стандартная фраза»- это многоместный предикат2, характеризующий определенную ситуацию. Обычно «стандартная фраза» представляет собой простое предложение с типовой структурой. Например, язык «стандартных фраз»
для поиска информации в области синтетической органической химии включает в свой состав фразу: Химическое вещество со структурой X находится в состоянии Y.
Схема или анкета (матрица, формуляр), «стандартная фраза», используемые при индексировании, позволяют унифицировать форму описания документа или запроса, обеспечивая единообразный подход различных.исполнителей к процессу составления поисковых образов, способствуют повышению качества и воспроизводимости 2 Предикат - это логическое сказуемое, то, что высказывается, утверждается или отрицается в суждении об объекте. Предикат отображает наличие или отсутствие того или иного признака у предмета (постоянства) индексирования.
3. Указатели связи. Это - символы, буквы или цифры, которые присоединяются к двум или более лексическим единицам ИПЯ с целью наглядного выражения существующей между ними логической связи.
Применение указателей связи наиболее характерно для дескрипторных ИПЯ, имеющих, как известно, лексику первого уровня интеграции, т. е. состоящую из отдельных слов и словосочетаний. Применение указателей связи вызвано тем обстоятельством, что отдельные слова и словосочетания (дескрипторы, унитермы, ключевые слова) могут образовывать не одно, а два или несколько осмысленных понятий, но при этом лишь одно из них будет соответствовать целям информационного поиска.
Например, в ИПС-70 на запрос Товарные знаки был выдан документ Внедрение прогрессивной технологии в производство мебели. Выдача нерелевантной информации произошла потому, что в тексте реферата документа содержалась фраза: «...улучшает их качество и товарный вид. Продукции присвоен знак качества». Совпадение лексических единиц запроса товарный и знак с аналогичными словами текста документа в условиях автоматизированной ИПС привело к «шумовой» выдаче. Для устранения таких ситуаций как раз и используются указатели связи. Возьмем в качестве указателей связи буквенные обозначения: а - для одной пары текстуально связанных лексических единиц и б - для другой пары. В этом случае можно получить в соответствии со смыслом и задачами информационного поиска попарно объединенные лексические единицы:
Указатели связи обычно применяют в ИПЯ, обладающем лексикой первого уровня интеграции, в двух случаях:
описывающие две разные темы или предметы одного документа;
описывающие одну тему или предмет документа.
4. Указатели роли. Это - символы, буквы или цифры, которые присоединяются к двум или более лексическим единицам и служат для обозначения логической роли (функции), выполняемой этой лексической единицей в поисковом образе.
Если указатели связи лишь фиксируют наличие связи между лексическими единицами ИПЯ, то указатели роли характеризуют эту связь. Указатели роли поясняют смысловую функцию лексической единицы в поисковом образе и задаются списком. Чаще всего эти списки представляют собой перечни логических категорий, которыми оперирует та или иная область знаний. Например, в дескрипторном ИПЯ отраслевой АСНТИ «Союзсельхозтехника» используются следующие указатели роли:
Р1 Основной объект рассмотрения Р2 Область, сфера, место применения РЗ Метод, способ, средство решения Р4 Отличительная часть, элемент, составляющая машины, сооружения, вещества и т. п.
Указатели роли используются для описания ситуаций, характерных для определенных тематических областей с ярко выраженной логической структурой. Следовательно, и число, и содержание их будут различными, определяясь особенностями отрасли знания, для которой создается данный ИПЯ.
Указатели роли уменьшают объем понятия, обозначаемого лексической единицей, что равносильно увеличению мощности массива смысловыражающих единиц ИПЯ, повышению избирательности языка и точности поиска. Хотя основной сферой применения указателей роли являются дескрипторные ИПЯ, тем не менее и в ИПЯ классификационного типа имеются аналогичные грамматические средства. Так, функцию указателей роли выполняют в УДК общие и специальные определители, в таблицах ББК - индексы территориальных типовых делений, общих типовых делений, специальных типовых делений. В алфавитно-предметной классификации целям уменьшения объема понятия, выражаемого предметной рубрикой, служат тематические (общие, типовые и специфические), географические, хронологические подзаголовки, а также подзаголовки назначения и формы.
В отношении указателей роли и связи следует подчеркнуть, что несмотря на то, что они предназначены для повышения точности информационного поиска, их применение может сопровождаться снижением полноты результатов поиска. Так, использование указателей связи позволяет повысить точность поиска информации до 10 %, а совместное использование указателей роли и указателей связи - на 15-17%, но при этом уменьшается полнота поиска. Это происходит из-за того, что индексаторы по-разному определяют функции лексических единиц в одном и том же тексте и соответственно могут присоединять к одинаковым лексическим единицам различные указатели роли.
ИПЯ, использующие указатели роли и связи, позволяют описывать тексты документов и запросов с большой точностью. Однако языки, обладающие этими грамматическими средствами, чрезвычайно сложны в эксплуатации, требуют утонченных процессов перевода и поиска, уступая по удобству и простоте использования более простым ИПЯ.
5. Грамматика логических операторов основана на использовании трех логических связок И, ИЛИ, НЕ, позволяющих осуществлять логическое умножение, сложение и вычитание лексических единиц, т. е. осуществлять операции алгебры логики (булевой алгебры). Оператор И означает операцию логического умножения - конъюнкцию;
оператор ИЛИ служит для обозначения логической суммы - дизъюнкции; оператор НЕ позволяет осуществлять логическое вычитание (отрицание). Операторы имеют свои обозначения: И - /\, ИЛИ - \/, НЕ -. Они отражают логические связи между лексическими единицами в запросе, например: Антикоррозийная защита /\ Подземный газопровод. Наземный.
Логические операторы И, ИЛИ, НЕ служат для уточнения объемов понятий, выражаемых лексическими единицами. Они используются, как правило, только при составлении поисковых предписаний и определяют стратегию поиска. С формальной точки зрения логические операции И, ИЛИ, НЕ являются грамматическим средством, но фактически их функция близка функции, выполняемой критерием смыслового соответствия. Кроме того, логические связки И, ИЛИ, НЕ часто служат для образования новых понятий, выраженных сочетанием лексических единиц, что сближает их функционально с указателями роли и указателями связи.
1.4. СОЗДАНИЕ ЛЕКСИКО-СЕМАНТИЧЕСКОИ ОСНОВЫ ИПЯ
Разработка любого ИПЯ, создание его лексико-семантической основы включает следующие основные этапы:1. Отбор лексических единиц.
2. Нормализация лексики.
3. Систематизация и группировка лексических единиц.
4. Построение классификационных схем понятий.
5. Организационное оформление лексики ИПЯ.
Отбор лексических единиц - важнейший этап в создании любого ИПЯ, поскольку «строительным материалом», из которого строится любой язык. Именно от качества выполнения этого этапа во многом зависят смыслоразличительные возможности ИПЯ, его семантическая сила. Этому этапу обязательно предшествует изучение структуры той отрасли науки или техники, искусства, по которой создается ИПЯ. Вот почему в состав разработчиков ИПЯ обычно входят не только информационные работники, библиотекари, библиографы, лингвисты, но и специалисты-отраслевики.
Занимаясь разработкой того или иного ИПЯ, его создатели отбирают в состав лексики не любые слова вообще, а «ключевые слова», т. е. слова, несущие в тексте наибольшую смысловую нагрузку. Поэтому при дальнейшей характеристике этого этапа работы будем считать условно синонимичными понятия «лексическая единица» и «ключевое слово».
Это допущение необходимо для уяснения сути технологических операций, выполняемых на данном этапе.
Ключевое слово - это полнозначное слово или словосочетание, являющееся носителем существенной в данном тексте (документе или запросе) информации с точки зрения информационного поиска.
К разряду ключевых слов следует отнести в первую очередь термины, важнейшими свойствами которых, как известно, является номинативность (способность называть предмет), однозначность, точность, отсутствие экспрессии.
Для каждой предметной области можно выделить три группы терминов:
1. Специальные термины, употребляемые только в данной отрасли знания, являющиеся как бы ее опознавательными знаками, символами. Например, по употреблению в речи или тексте такой группы терминов, как диагноз, гастрит, анестезия, переливание крови или залегание пласта, антрацит, угольный карьер, проходка, метаноопасность, мы всегда безошибочно укажем соответствующую отрасль знания.
2. Термины смежных отраслей знания, «привлеченные» термины, обозначающие необходимые для данной предметной области понятия из смежных отраслей науки и техники. Они отражают важнейшую закономерность развития современной науки: интеграцию, взаимопроникновение научных идей. Так, в медицинской терминологии обязательно используются биологические, химические термины; терминология горного дела активно привлекает лексику геологии, кристаллографии.
5. Общенаучные термины, бытующие в любой отрасли знания, например: метод, анализ, оборудование, дефект, исследование, объект и т. п.
Разработчикам ИПЯ приходится всякий раз решать, к какой группе терминов относится то или иное слово, насколько целесообразно его включение в состав лексики ИПЯ, так как пропуск лексических единиц влечет за собой неизбежные потери информации при поиске, а излишнее расширение словарного состава делает его громоздким, неудобным, затрудняет поиск.
Очевидно, что в первую очередь в состав лексики разрабатываемого ИПЯ должны включаться термины первой группы. Именно они являются ключевыми. Отсутствие же формальных критериев значимости или незначимости терминов второй и третьей групп для конкретного ИПЯ существенно осложняет этап их отбора.
Связав понятие «лексическая единица» с понятиями «ключевое слово» и «термин», целесообразно указать категории неключевых слов, т. е. слов, которыми можно пренебречь в условиях создания лексико-семантической основы ИПЯ. К ним относятся служебные слова (частицы, предлоги, союзы, междометия); часто употребляемые общенаучные термины типа проблема, актуальность, значение и т. п.; термины, не относящиеся к понятийному аппарату того раздела науки или техники, для которого создается конкретный ИПЯ. Например, для ИПЯ по библиотековедению вряд ли имеет смысл включать в состав лексики термины электродвигатель, плазма и т. п.
Итак, отнесение конкретного термина к разряду ключевых слов зависит от прагматических соображений, определяемых тематическим охватом создаваемого ИПЯ, а также возможностями возникновения запроса, содержащего данное слово или словосочетание.
В качестве основных источников отбора лексических единиц можно назвать следующие: 1) уже существующие, т. е. ранее разработанные ИПЯ, располагающие фиксированным словарем: таблицы УДК, ББК, списки предметных рубрик, классификаторы, тезаурусы и т. п.; 2) терминологические словари, справочники, ГОСТы, словари толковые, энциклопедические и аналогичные нормативно-справочные издания; 3) массив документов по тематике создаваемого ИПЯ с хронологическим охватом в 5-б лет (именно за этот период происходит обновление терминологии), объемом 3-4 тыс. документов. Такой объем позволяет получить представительный массив лексики, достаточно полно характеризующий ту отрасль знания, по которой создается ИПЯ; 4) массив запросов, полученных от потребителей информации, содержащий, как правило, наиболее новые термины. Обычно при разработке ИПЯ все эти источники отбора лексики используются одновременно, в комплексе.
Отобранные в результате анализа лексические единицы образуют словник ключевых слов - исходный терминологический массив. Важнейшее требование к полученному словнику - полнота охвата лексических единиц, так как основное назначение лексических единиц ИПЯ - служить средством образования ПОД или ПП и, в конечном итоге, средством поиска информации.
Нормализация лексики. После того, как лексические единицы (ключевые слова, термины) отобраны, возникает задача их единообразной записи, нормализации. Строго говоря, проблема нормализации решается одновременно с отбором лексических единиц, однако для удобства рассмотрения целесообразно нормализацию лексики охарактеризовать как самостоятельный этап создания лексико-семантической основы ИПЯ.
Нормализация лексики реализуется посредством двух операций: 1) представлением ключевых слов в единообразной грамматической форме (морфологический уровень нормализации лексики); 2) устранением синонимии и полисемии (семантический уровень).
Представление ключевых слов в единообразной грамматической форме, в свою очередь, складывается из следующих основных процедур:
Установление унифицированной формы записи лексических единиц (род, число, падеж). Как правило, исчисляемые существительные рекомендуется записывать в именительном падеже множественного числа, неисчисляемые - в именительном падеже единственного числа: датчики, радиодетали, документы, но информация, реле, резонанс.
Прилагательные и причастия записываются в именительном падеже множественного числа: лабораторные, информационные, предшествующие. Следует отметить, что эти правила вариативны и для различных ИПС могут быть изменены;
Решения вопроса о формулировке ключевого слова: запись в виде отдельного слова (унитерм) или словосочетания? В первом случае это будут отдельные слова:
автоматизированные, информационные, поисковые системы. Во втором - развернутые словосочетания: автоматизированные информационно-поисковые системы, травы однолетние злаковые.
Ориентация на отдельные слова (унитермы) позволяет достигать значительной глубины и детальности индексирования, дает возможность свободно манипулировать элементами поисковых образов. Однако при этом требуется разработка сложной системы грамматических средств для предотвращения информационного шума. Кроме того, механическое разделение многословных терминов, соответствующих определенным научно-техническим понятиям, неизбежно приводит к потерям при поиске информации, снижению точности выдачи.
На практике в качестве единой лексической единицы обычно используются устойчивые словосочетания, выражающие целостные (неделимые) понятия. Однако критериев, позволяющих четко и однозначно отделять устойчивые словосочетания от неустойчивых, в настоящее время не существует, а имеющиеся рекомендации носят неформализованный характер. Чаще всего решение о сохранении словосочетания как отдельной лексической единицы принимается на основании статистических данных (наблюдений о частоте встречаемости словосочетания в анализируемом массиве текстов) либо при условии, что в данном ИПЯ очень мала вероятность использования компонентов словосочетания по отдельности.
В том случае, если в разрабатываемом ИПЯ решено использовать в качестве лексических единиц не только отдельные слова, но и словосочетания, возникает необходимость определения порядка записи слов в словосочетании. Применительно к словосочетаниям, состоящим из прилагательного(ных) и существительного(ных) возникает дилемма: прямой (библиотечные фонды, оптические фильтры) или инвертированный (фонды библиотечные, фильтры оптические) порядок записи следует использовать. На этот счет также отсутствуют убедительные и достаточно формализованные критерии, носящие универсальный характер. Решение по этому вопросу принимается индивидуально в каждом конкретном случае разработчиками ИПЯ.
Для обеспечения экономичности и единообразия формулировок лексических единиц существуют рекомендации о целесообразности инвертированной формы записи, обеспечивающей выдвижение на первое место в словосочетании существительного (каталоги алфавитные, реакции химические). Однако абсолютизировать принцип инверсии нельзя, так как зачастую его использование влечет за собой образование лексических единиц, первое слово которых не выполняет эвристической функции, либо разрушает общепринятый термин.
Устранение полисемии и омонимии на этапе нормализации лексики достигается двумя способами. Первый, наиболее простой способ заключается в развертывании многозначного слова до словосочетания. Например, сети: сети рыбацкие, сети библиотечные; лист: лист бумажный, лист растения.
Второй способ, именуемый лексикографическим, связан с использованием специальных ограничительных или пояснительных помет. Для устранения полисемии и омонимии могут использоваться следующие типы пояснений, помещаемых в скобках рядом с многозначным словом:
(ответвление);
Отнесение слова к соответствующей отрасли знания: ребро (геометрия), ребро (авиация), ребро (анатомия);
Отнесение слова к соответствующей категории: емкость (предмет), емкость (характеристика), смазка (процесс), смазка (материал);
Указание на соответствующее слову родовое понятие: танк (резервуар), танк (вооружение);
Указание на соответствующие объекты действия: обработка (пищевых продуктов), обработка (информации).
Систематизация лексики. На этом этапе необходимо все отобранные и записанные в стандартной форме лексические единицы систематизировать, упорядочить, установить между ними смысловые связи, образовать классы близких по значению слов. В силу избыточности естественного языка в составе полученного словника ключевых слов неизбежно будут иметь место слова, находящиеся в отношениях эквивалентности, смысловой близости. Поэтому важнейшей задачей этапа систематизации лексики является установление парадигматических отношений между отобранными лексическими единицами и построение классов условной эквивалентности.
Класс условной эквивалентности - это совокупность лексических единиц, которые считаются условно синонимичными в данной области знания и используются в данном ИПЯ как равнозначные с точки зрения поиска информации. Между лексическими единицами, входящими в один класс условной эквивалентности, могут существовать следующие отношения: 1) равнозначности, тождества, выражаемые синонимами; 2) пересечения - частичного совпадения объемов понятий, т. е. отношения, связывающего слова, между которыми существует ассоциативная связь, семантическое родство; 3) подчинения, т. е. отношения типа «род-вид», «целое- часть», «выше-ниже».
Построение классификационных схем понятий. Классификационная схема понятия - это графическое средство фиксирования парадигматических связей между понятиями. Ее основное назначение - обозначение границы того или иного понятия, определение объема, содержания и структуры понятия, установление его связей с другими понятиями. Разработка классификационной схемы включает: выделение наиболее существенных признаков понятия в качестве основания деления; построение частных схем, отражающих взаимосвязь понятий и использующих выделенные признаки. В соответствии с правилами формальной логики деление объема понятий, осуществляемое при построении классификационной схемы, должно быть обоснованным, взаимоисключающим, адекватным по объему, непрерывным.
Классификационные схемы понятий позволяют учитывать действительные связи, существующие между понятиями, получать строго упорядоченную систему понятий, наглядно представлять смысловые отношения, объединяющие лексические единицы ИПЯ.
Организационное оформление лексики ИПЯ. Организационное оформление лексики - это ее графическое, знаковое воплощение, которое целиком зависит от типа разрабатываемого ИПЯ. В зависимости от типа создаваемого ИПЯ, его функционального назначения, нормализованные и систематизированные лексические единицы будут преобразованы либо в предметные рубрики, либо в дескрипторы, либо в индексы классификации и т. д. Например, лексико-семантическая основа ИПЯ может быть организационно представлена в виде таблиц классификации (УДК, ББК, МКИ, Единая схема классификации литературы для книгоиздания в СССР и др.), рубрикаторов (Рубрикатор ГАСНТИ, Рубрикатор МСНТИ), классификаторов (Общесоюзный классификатор профессий рабочих и должностей служащих, Общесоюзный классификатор отраслей народного хозяйства), словарей предметных рубрик, информационно-поисковых тезаурусов и ряда других пособий, образующих комплекс лингвистических средств ИПС.
Итак, в составе любого ИПЯ можно выделить логико-лингвистические универсалии, к которым относятся алфавит, лексика, парадигматические и синтагматические отношения. В совокупности все эти элементы составляют своего рода универсальную модель ИПЯ, с помощью которой можно проводить анализ как уже существующих языков, так и языков, специально конструируемых для той или иной библиотечноинформационной системы.
Знание структуры ИПЯ позволяет рационально организовать технологию разработки новых языков, проводить сопоставительный анализ семантической силы уже существующих ИПЯ, осуществлять обоснованный выбор ИПЯ для решения определенного круга задач в соответствии с выполняемыми ИПЯ функциями.
Принадлежность ИПЯ к той или иной группе или типу языков составляет одну из его важнейших характеристик. Типология - это научный метод, основа которого - расчленение системы объектов и их группировка с помощью обобщенной модели или типа. Она используется в целях сравнительного изучения существенных признаков, связей, функций, отношений, уровней организации объектов. Следовательно, отнесение того или иного ИПЯ к определенному типу позволит определить его наиболее существенные свойства, вскрыть преимущества и ограничения в сфере употребления.
Наряду с систематикой и таксономией к числу основных логических форм типологии относится классификация.
В настоящее время в специальной литературе нет единой классификации ИПЯ.
Представление о сложившихся подходах к выделению различных типов ИПЯ можно получить, обратившись к публикациям , содержащим попытки их упорядочения, типизации по различным признакам. Именно множество признаков, которыми обладает ИПЯ, породило многообразие классификаций.
Для того чтобы дать характеристику основных типов ИПЯ, примем в качестве обязательного утверждение, что требование отнесения какого-либо языка к тому или иному типу не должно выполняться целиком для всех без исключения явлений данного языка, т. е. «нет правил без исключения». Таким образом, в дальнейшем рассмотрении будем ориентироваться не на то, каков язык весь, а на то, что для него наиболее характерно.
посткоординированные и предкоординированные, причем сразу следует подчеркнуть, что в чистом виде эти два типа языков практически не существуют, и речь может идти лишь о преобладании характерных черт в том или ином информационно-поисковом языке.
В том случае, если словарный состав ИПЯ состоит преимущественно из изолированных слов и словосочетаний, которые объединяются между собой (координируются) только в процессе индексирования, то такой ИПЯ следует отнести к типу посткоординатных, или координатных, языков. Для уяснения сути этого типа языков принципиально важным является понимание метода координатного индексирования как способа описания смысла документа с помощью выявленных в его тексте наиболее значимых, или ключевых, слов. Типичным примером языков посткоординатного типа являются язык системы «Унитерм», дескрипторный ИПЯ.
Отличительная особенность языков предкоординатного типа заключается в том, что в их словарь входят не только отдельные слова и словосочетания, но и, преимущественно, развернутые словосочетания и целые фразы. В таких словосочетаниях и фразах слова оказываются связанными (координированными) между собой еще до индексирования, т.
являются, например, УДК, ББК. В основе предкоординатного индексирования лежит принцип выявления тематики всего документа (запроса, факта) в целом и сравнения этой выявленной тематики с заранее заготовленным (предкоординированным) списком лексических единиц ИПЯ, из которых надо выбрать наиболее подходящие по смыслу.
Предкоординированные ИПЯ обслуживают целый комплекс поисковых задач. При любой поисковой задаче, когда из данной совокупности объектов нужно выбрать объекты с определенными свойствами, возникает вопрос: как ускорить процедуру поиска, как сократить перебор? Одно из самых простых решений, которым человечество пользуется с незапамятных времен,- разбить все объекты из данной совокупности на группы таким образом, чтобы в одной группе оказались объекты с одинаковыми свойствами. Иными словами, речь идет о классификации.
Классификация - это распределение предметов какого-либо рода на взаимосвязанные классы согласно наиболее существенным признакам, присущим предметам данного рода и отличающим их от предметов других родов, при этом каждый класс занимает в получившейся системе определенное постоянное место и, в свою очередь, делится на подклассы. Класс - это совокупность объектов, имеющих один или несколько общих характеристических признаков. Отличительный, характерный признак, по которому.производится деление предметов на классы, называется основанием деления.
Одним из древнейших предкоординированных ИПЯ, используемых в библиотечнобиблиографической практике, являются классификационные языки, или библиотечнобиблиографические классификации. Наиболее широкое применение среди них получили иерархические классификации.
2.1. ИЕРАРХИЧЕСКИЕ КЛАССИФИКАЦИИ КАК ИПЯ: ПРИНЦИПЫ
ПОСТРОЕНИЯ, СТРУКТУРА
Иерархические классификации - это классификации, между подразделениями которых существуют только два отношения: иерархии и соподчинения. Иерархия - это отношение, при котором один класс является подклассом другого, более широкого класса. Соподчинение - это отношение, которое связывает классы, являющиеся подклассами одного более широкого класса, т. е. отношения между подклассами одного и того же класса.Иерархическая классификационная система строится по следующему принципу:
исходное множество объектов классификации делится в соответствии с выбранным основанием деления на крупные группировки - классы. Затем каждый класс разбивается на ряд последующих группировок - подклассов, которые, в свою очередь, распадаются на более мелкие, постепенно конкретизируя объект или его свойства.
В результате классификационные группировки образуют многоуровневую ветвящуюся систему, обычно изображаемую в виде древовидного графа, блока-схемы группировкам, а на «ветвях» расположены классификационные деления, находящиеся в иерархическом подчинении - так называемая классификационная ветвь.
Основными характеристиками иерархических классификаций как ИПЯ являются количество ступеней классификации (уровней), глубина и емкость.
Количество ступеней (уровней) определяет глубину системы классификации, которая устанавливается в зависимости от необходимого для решения задач числа признаков, применяемых при классификационном делении и характеризующих свойства классифицируемых объектов, а также от необходимой степени конкретизации группировок.
В различных ИПЯ глубина иерархии измеряется по-разному. В УДК она равна десяти, в Рубрикаторе ГАСНТИ - трем уровням классификационного деления. Емкость иерархической классификации - это также один из важнейших показателей семантической силы ИПЯ, характеризующий мощность его словарного состава: в УДК, например, общее число индексов, т. е. лексических единиц, достигает 250 тыс., не считая определителей, а в Рубрикаторе ГАСНТИ тот же параметр измеряется 6118 индексами, т.
е. емкость этого ИПЯ весьма незначительна.
Алфавит иерархических классификаций по своему составу может быть либо цифровым, либо смешанным, включающим как цифры, так и буквы. В обоих случаях в состав алфавита могут входить знаки пунктуации (точка, дефис, апостроф, двоеточие, запятая, косая черта, скобки), специальные знаки и символы (знак стрелки, квадрата). В группу ИПЯ с цифровым алфавитом входят УДК, рубрикаторы, классификаторы.
К ИПЯ со смешанным алфавитом, включающим буквы и цифры, относятся ББК (за исключением варианта таблиц для массовых, а также детских и школьных библиотек) и Международная классификация изобретений (МКИ). В таблицах ББК для научных библиотек используются заглавные и строчные буквы кириллического (русского) алфавита, арабские цифры, знаки пунктуации, специальные символы. Кроме того, для обозначения специальных индексов лингвистических, хронологических, территориальных и других - используются буквы латинского алфавита и римские цифры.
В буквенно-цифровой алфавит МКИ входят латинские буквы, заглавные и строчные, арабские цифры, знаки пунктуации. Заглавные латинские буквы - от А до Н - обозначают восемь основных разделов классификации; дальнейшие деления МКИ обозначаются арабскими цифрами и строчными буквами латинского алфавита.
Во всех иерархических классификациях такой элемент алфавита, как точка, служит для разграничения уровней иерархии в структуре индекса.
Структура лексической единицы любой из иерархических классификаций имеет смешанного) деления системы классификации со словесной формулировкой. В таких языках, как УДК, ББК, МКИ, ЕКЛ, основной лексической единицей является классификационный индекс и соответствующая ему словесная формулировка - классификационная рубрика. Лексическая единица в рубрикаторах именуется кодом и также сопровождается рубрикой. Классификаторы в качестве основного элемента лексики располагают классификационной группировкой, состоящей из цифрового кодового обозначения и его наименования на естественном языке. Иными словами, несмотря на разницу в терминологии, лексические единицы иерархических классификаций имеют одинаковую структуру (см. табл. 2.1).
Характеристика лексики иерархических классификаций будет неполной без определения понятия классификационный индекс и указания его разновидностей.
Классификационный индекс - это условное обозначение деления какой-либо системы классификации, к которой относится библиографируемый документ.
Таблица 2.1. Структура лексических единиц иерархических Условное обозначение (план Словесная формулировка (план Индексы основных таблиц классификации называются простыми, индексы вспомогательных таблиц - типовыми. Сложный индекс - классификационный индекс, состоящий из комбинации индекса основных таблиц с одним или несколькими индексами вспомогательных таблиц. Составной индекс - классификационный индекс, состоящий из комбинации двух или нескольких индексов, каждый из которых может быть представлен индексом основных таблиц классификации или сложным индексом.
Анализ словарного состава иерархических классификаций позволяет выделить основные его характеристики. Они суть следующие.
1. В плане выражения лексическая единица иерархической классификации представляет собой условное (знаковое) обозначение - индекс, код, а в плане содержания - понятие, закрепленное в словесной формулировке. План содержания и план выражения лексических единиц в этих ИПЯ не совпадают, следовательно, иерархические классификации являются кодированными ИПЯ. Коды в иерархических классификациях выполняют ряд важных функций, обеспечивающих существенные преимущества этой группы ИПЯ в целом:
Позволяют однозначно определять понятия, выраженные любым способом, как отдельным словом, словосочетанием, так и целой фразой. Словесные эквиваленты кодов (план содержания) обеспечивают возможность взаимодействия ИПС и человека путем кодирования и декодирования понятий;
Дают возможность обеспечить процесс индексирования удобным для работы материалом - лексическими единицами если не постоянной, то, по крайней мере, фиксированной длины. Например, каким бы сложным ни было понятие в Рубрикаторе ГАСНТИ, какой бы протяженностью, т. е. количеством слов оно ни измерялось, код этого понятия не превысит восьми знаков (включая точки как разделительные знаки), например: 55.30 Робототехника, 55.30.33 Технологическая оснастка, периферийные устройства и вспомогательное оборудование роботов и манипуляторов. В условиях эксплуатации автоматизированных библиотечных систем это свойство имеет немаловажное значение, так как позволяет рассчитывать объемы памяти ЭВМ при структурировании баз данных;
Позволяют более оперативно вести сопоставление результатов индексирования документов (ПОДов) и запросов (ПП) в условиях ручного или интеллектуального поиска информации. Человек, ведущий поиск в массиве закодированных рубрик по закодированному запросу, может действовать достаточно формализованно и в итоге достаточно производительно, так как ему не приходится читать текст каждой рубрики, вдумываясь в то, насколько она относится к запросу.
2. Все иерархические классификации представляют собой кодированные ИПЯ, располагающие структурированным кодом. Структурированность лексических единиц (индексов, кодов, классификационных группировок) проявляется в характере их обозначения: уровни иерархии разграничиваются точкой, следовательно, каждая позиция в структуре кода имеет строго определенный смысл. Очевидным преимуществом структурированных кодов является возможность явного выражения парадигматических отношений, что позволяет установить связи между понятиями, облегчить изучение какихлибо явлений и процессов. Например, лексическая единица ББК 26.231.153 Мезопауза характеризует некое неизвестное нам понятие. Обратившись к кодовым обозначениям в таблице ББК (благодаря структурированности кодов), можно получить представление о той области знания, где применяется данное понятие:
3. По способу задания лексика иерархических классификаций относится к контролируемым ИПЯ, так как все лексические единицы задаются и фиксируются в специально разработанных словарях-таблицах классификации, рубрикаторах, классификаторах и т. п. Произвольная лексика сообщений (фактов, документов, запросов) подлежит замене на нормативную лексику из этих словарей.
4. Иерархические классификации как ИПЯ располагают вторым уровнем интеграции лексики, так как их лексические единицы могут состоять не только из отдельных слов, словосочетаний, но и включать в свой состав целые речевые обороты, предложения.
Такие предложения чаще всего относятся к разряду назывных. При этом наблюдается тенденция усложнения структуры назывных Предложений по мере продвижения в структуре иерархической классификации «сверху-вниз». Конкретизация понятия достигается путем логического пересечения вышестоящих понятий с другими, выступающими в роли классификационных признаков. При подъеме по иерархии вверх, наоборот, структура назывных предложений в классификационных рубриках, как правило, упрощается, и нередко назывные предложения «вырождаются» в отдельные слова, например, в ББК:
22.317.22 Классическая и квантовая статистика, обоснование статистической физики 22.317.2Статистическая физика Термодинамика и статистическая физика Парадигматические отношения в иерархических классификациях выражены двумя способами: 1) в иерархическом способе построения таблиц и логической структуре кодов; 2) с помощью ссылочно-справочного аппарата.
Иерархический способ построения таблиц предполагает преобладание двух видов отношений между понятиями - иерархии и «подчинения. Перед каждым классом в таблицах классификации перечисляются его основные деления, что сразу ориентирует нас в схеме классификации и последовательности ее разделов.
Иерархичность структуры, ступенчатый ход от общего к частному, характеризующий соподчиненность понятий, наглядно отражается в структуре индекса. Логически выразительный индекс указывает число пройденных ступеней классификации. Каждая новая ступень классификации автоматически удлиняет индекс. Каждый знак справа в индексе является субординированным, подчиненным, отражая главное свойство этого типа ИПЯ - реализацию отношений иерархии и соподчинения. В качестве примера сельскохозяйственной продукции»:
35.8 Кабели, провода и шнуры межотраслевого назначения Точность Полнота 35.82.1 Провода монтажные с медной жилой 35.82.12 Провода монтажные с медной жилой с поливинилхлоридной Итак, парадигматические отношения в иерархических классификациях выражены в явном виде в логической структуре индекса. При этом конкретный вид (сильные, слабые) парадигматических отношений в структуре индекса не указывается и сводится к отношениям подчинения, иерархии - «выше-ниже», - и соподчинения. Чем детальнее индекс, тем уже, конкретнее выражаемое им понятие.
Помимо структуры индекса эксплицитное представление парадигматических отношений в иерархических классификациях осуществляется с помощью ссылочносправочного аппарата. Его основное назначение - служить средством разграничения пересекающихся по смыслу рубрик и отражения полииерархических связей разделов.
Иными словами, средства ссылочно-справочного аппарата служат для того, чтобы показать взаимосвязь между разделами схемы классификации, выявить близкие понятия.
Ссылочно-справочный аппарат иерархических классификаций как ИПЯ - это совокупность указаний, фиксирующих связи и размежевания между классификационными делениями. К ним относятся примечания, ссылки, отсылки, пометы.
Примечания - это совокупность указаний, поясняющих связи и размежевания между отдельными рубриками. Они уточняют содержание раздела, говорят о его дальнейшем подразделении. Например:
Примечание: Вопросы международного классификации.
сотрудничества по отдельным отраслям Примечание: Отрасли обозначать при науки отражаются в соответствующих раз- помощи 0/9, например: 025.4.06:54 ИПЯ делах наук с окончанием кода ХХ.01.27 по химии Отсылка смотри - (см.) адресует от возможного местонахождения понятия к принятому в данном ИПЯ и исключает дублирование рубрик. Отсылка указывает на то, что предмет, который тесно связан с данным разделом, находится не в этом разделе, а под другим индексом. Например, в ЕКЛ:
(Музыкальный театр - см. 49.7, военные оркестры - см. 13.4) 13.4 Вооруженные силы СССР 4. Военные парады, церемонии, празднества. Военные оркестры.
13.07.27 Социология культуры 04.51.51 Социология культуры Ссылка отсылка от (отс. от) является обратной к ссылке смотри и ставится при рубрике, на которую имеется ссылка см., например:
19. Кино как средство массовой инфоормации пропаганды Киноискусство В УДК отсылка см. и ссылка см. также заменены стрелкой ®, которая меняет свой смысл в зависимости от положения в указании; ссылка начинается со стрелки, затем следует индекс и текст, а отсылка начинается с текста, после которого приведена стрелка и индекс, например:
543.4 Оптические методы анализа 543.9 Анализ посредством биологических реакций Реакция на ферменты и витамины ® 577.15/16 (отсылка) Роль, аналогичную стрелке в УДК, в ББК выполняет знак квадрат, показывая наличие смысловых (парадигматических) связей между понятиями. Например:
85.38 Художественное радиовещание и телевидение Итак, функции ссылки и отсылки в реализации парадигматических отношений различны: если ссылка напоминает о существовании других, родственных по тематике разделов, т. е. расширяет область поиска, то отсылка, наоборот, выполняет запретительную функцию, предупреждая, что данное понятие нельзя обозначать этим индексом.
Электронное текстовое издание Подготовлено кафедрой Технологии и средства связи Научный редактор: проф. д-р фил. наук Попова Т. В. Практикум для студентов всех форм обучения. Практикум содержит задания и упражнения, которые призваны помочь студенту освоить трудности современного русского языка, а также повысить общий уровень речевой культуры. ©...»
«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ БАШКИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ (БАШГУ) БИРСКИЙ ФИЛИАЛ УТВЕРЖДАЮ Директор БФ БашГУ проф. С.М. Усманов 2014г. Программа принята на заседании кафедры русского языка и литературы, методики преподавания русского языка и литературы _ зав. кафедрой 2014г. Программа вступительного экзамена в аспирантуру по направлению 45.06.01 Языкознание и литературоведение (направленность...»
«Докинз Р. Эгоистичный ген Ричард Докинз - профессор Оксфордского университета, автор таких известных книг, как Эгоистический ген, Слепой часовщик, Расширенный фенотип и др. В книге английского автора представлен один из современных подходов к проблеме эволюции. Рассмотрены биологические основы поведения и его роль в естественном отборе. Книгу отличает блестящий, увлекательный стиль изложения. Первое издание было международным бестселлером, переведено на 13 языков и широко используется в мире...»
«История Деградации Азбуки Или как мы потеряли Образы Буковъ Томск - 2012 год www.dm80.ru 1 Виды письменности в древней Руси В современной исторической науке принято считать, что до прихода Кирилла и Мефодия Славяне были Варварами, людьми второго сорта, дикарями, которые жили в лесу, не имели своей письменности и соответственно не умели ни читать ни писать. Эта общепринятая информация почему-то вызывает много противоречий с реальными историческими данными и с результатами раскопок на территории...»
«Язык и культура: новый взгляд 1 Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования Поморский государственный университет имени М.В. Ломоносова Язык и культура: новый взгляд Сборник статей Архангельск Поморский университет 2009 2 Составители и ответственные редакторы: Л.Ю. Щипицина, Е.В. Тряпицына Печатается по решению редакционно-издательской комиссии факультета иностранных языков Поморского университета Язык и культура: новый...»
«Книга Юлия Ковальчук. Наблюдая за японцами. Скрытые правила поведения скачана с jokibook.ru заходите, у нас всегда много свежих книг! Наблюдая за японцами. Скрытые правила поведения Юлия Ковальчук 2 Книга Юлия Ковальчук. Наблюдая за японцами. Скрытые правила поведения скачана с jokibook.ru заходите, у нас всегда много свежих книг! 3 Книга Юлия Ковальчук. Наблюдая за японцами. Скрытые правила поведения скачана с jokibook.ru заходите, у нас всегда много свежих книг! Юлия Ковальчук Наблюдая за...»
«c Суббота, 21 марта 2009 года № 19 (1161) Газета города Юбилейного Московской области Основана в декабре 1993 года Браво, Букрины! Приветствуем вас, наши читатели! Сегодня В городе немало семей, состоящих из военных и учёных, из учителей и предприв номере: нимателей. И вот появилась семья писателей – членами Союза писателей России стали Наталья Андреевна и Валерий Васильевич Букрины. Они – офицеры, много лет живут в Юбилейном. Их книги о О городе и его жителях. космосе и ракетчиках, написанные...»
«Этот электронный документ был загружен с сайта филологического факультета БГУ http://www.philology.bsu.by ВВЕДЕНИЕ Способность человека к гармоничному и конструктивному общению с другими людьми, на формирование которой направлен курс риторики, позволяет установить и укрепить деловые и межличностные контакты, достичь более высокого социального статуса, авторитетности, самоуважения. Поскольку риторика изучает технологии формирования замысла и содержания речи, риторическое развитие личности...»
«A.M. М алолетко ДРЕВНИЕ НАРОДЫ СИБИРИ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОЮ ОБРАЗОВАНИЯ ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ А.М. МАЛОЛЕТКО ДРЕВНИЕ НАРОДЫ СИБИРИ ЭТНИЧЕСКИЙ СОСТАВ ПОДАННЫМ т о п о н и м и к и Том I Часть первая ПРЕДЫСТОРИЯ ЧЕЛОВЕКА И ЯЗЫКА Издание 2-е, исправленное и дополненное Издательство Томского университета 2011 УДК 413.11 ВВК Т52 MI X Рецензенты: доктор географических наук Г.Я Барышников. доктор филологических наук О.А. Осипова. доктор...»
«НАРУШЕНИЯ ЕДИНОБОЖИЯ ‘Абдуль ‘Азиз ар-Раййис1 Да хранит его Аллах! Админ сайта www.islamancient.com Сноски и примечания подготовлены издательским домом СВЕТ ИСЛАМА Первое издание - 2008 - 1 Мы обратились к автору непосредственно, а также через уважаемых им людей, с просьбой прислать нам краткую автобиографию, однако он ответил отказом, сказав: Кто я такой, чтобы меня знали?! Главное – распространять правду с доказательствами. Писать о себе не хочу – боюсь самовосхваления. Напишите после смерти....»
«Подарок молодым Хозяевам и Хозяйкам. Старая Кухня XIII-XVII вв, или Сборник старых Кушаний, старательно собранный и переведённый с аглицкого и других Языков с Целью просветить и накормить. 2007 ноябрь Содержание ВСТУПЛЕНИЕ О СБОРНИКЕ ANONIMO VENEZIANO. LIBRO PER CUOCO. ВЕНЕЦИЯ, XIV-XV ВВ VI. ЦЫПЛЯТА В ПОХЛЁБКЕ (CHICKENS WITH BROTH) X. МАСЛО ИЗ СВЕЖЕГО СЫРА (BUTTER OF FRESH CHEESE) XII. ЯИЧНАЯ ПОХЛЁБКА, ПРОСТАЯ, ХОРОШАЯ И СОВЕРШЕННАЯ (BROTH OF EGGS PURE, GOOD AND PERFECT).10 XXXV. ОМЛЕТ С...»
«ПРОГРАММА ПО ЛИТЕРАТУРНОМУ ЧТЕНИЮ для школ с русским (родным) языком обучения ПОЯСНИТЕЛЬНАЯ ЗАПИСКА Общая характеристика учебного курса и его место в учебном плане Поскольку речевая деятельность является основным средством познания и коммуникации, литературное чтение является одним из ведущих учебных предметов в системе подготовки младшего школьника, способствующим общему развитию, воспитанию и социализации ребенка. Успешность изучения курса литературного чтения, входящего в предметную область...»
«НА ПИКЕ ВУЛКАНОВ Информационное издание государственного заповедника Курильский, № 1(6) июнь 2014 У ногие любуются важаемые читатели, друзья, коллеги! Мприродой, но немногие Наша газета На пике вулканов переходит в новый формат и продолжает в интересной форме живым языком рассказывать на своих страницах об ее принимают к сердцу, и даже тем, уникальных уголках заповедника, островных растениях и животных, о существукто к сердцу принимает, не часто ющих проблемах и о многом другом. Как и раньше,...»
«УДК 796 ББК 53.54 В 19 ВАСИЧКИН ВЛАДИМИР ИВАНОВИЧ Профессор Академии здоровья и экологии Санкт-Петербурга, автор книг, справочников, методик лечебного массажа, изданных многомил лионными тиражами в России, странах СНГ и за рубежом. Огромное количество писем и отзывов читателей, а также личные беседы со слушателями практических курсов по массажу позволили автору вновь издать данную книгу с некоторыми дополнениями и примечаниями. Опираясь на работы создателей российской школы массажа и на...»
«Казанский (Приволжский) федеральный университет Научная библиотека им. Н.И. Лобачевского ВЫСТАВКА НОВЫХ ПОСТУПЛЕНИЙ с 26 января по 3 февраля 2012 года Казань 2012 1 Записи сделаны в формате RUSMARC с использованием программы Руслан. Материал расположен в систематическом порядке по отраслям знания, внутри разделов – в алфавите авторов и заглавий. С обложкой, аннотацией и содержанием издания можно ознакомиться в электронном каталоге http://www.ksu.ru/lib/index1.php?id=6&idm=0&num=2 2 Содержание...»
«ТЕКСТЫ ДЛЯ ЧТЕНИЯ И БЕСЕД О М.В. ЛОМОНОСОВЕ Скоро сам узнаешь в школе, Как архангельский мужик По своей и Божьей воле Стал разумен и велик. Н.А. Некрасов Литературно-художественные произведения о Ломоносове, представленные в данном разделе, могут быть использованы для работы с детьми на уроках чтения, внеклассного чтения, истории, что может составить содержание регионального компонента начальной школы, а также при проведении внеклассных мероприятий, на которых учащиеся знакомятся с жизнью и...»
«АННОТАЦИЯ (содержание) рабочей программы учебной дисциплины по подготовке бакалавра в рамках ФГОС ВПО по направлению 030900.62 Юриспруденция профиль государственно-правовой Дисциплина Иностранный язык в сфере юриспруденции входит в базовую часть гуманитарного, социального и экономического цикл (блок Б.1) дисциплин подготовки студентов по направлению 030900.62 Юриспруденция. Дисциплина реализуется в ЮИ Красноярского государственного аграрного университета, кафедрой проф. Коммуникаций и...»
«Приложение 3 ОД. Общеобразовательные дисциплины ОДБ Базовые общеобразовательные дисциплины ОДБ.01 Аннотация программы учебной дисциплины Иностранный язык Цель и задачи дисциплины Целью освоения учебной дисциплины является развитие умений иноязычного общения в различных сферах и ситуациях; формирование и практическое применение языковых навыков. Место дисциплины в структуре ОПОП СПО Дисциплина Иностранный язык относится к циклу общеобразовательных дисциплин. Содержание дисциплины служит основой...»
«Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Амурский государственный университет Кафедра русского языка УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС ДИСЦИПЛИНЫ ОБЩЕЕ ЯЗЫКОЗНАНИЕ (наименование учебной дисциплины по учебному плану) Основной образовательной программы по специальности 031001.65 Филология специализация Русский язык и литература Благовещенск 2011 УМКД разработан доцентом кафедры русского...»
СТРУКТУРА И НАЗНАЧЕНИЕ ИНФОРМАЦИОННО-ПОИСКОВОГО ЯЗЫКА (ИПЯ) ИПЯ как разновидность искусственных языков Любой язык является знаковой системой, выполняющей познавательную и коммуникативную роль в процессе человеческой деятельности. Язык может быть естественный либо искусственный. Языки, которые используются как средство общения, обмена мыслями и взаимного понимания в человеческом обществе называются естественными. Искусственным языком называется любой вспомогательный язык, созданный людьми для каких-либо узких целей, разрабатываются исскуственные языки на основе естественных. Почему возникла необходимость создания исскуственных языков? В естественном языке нет однозначного соотношения между словами и их значениями, одно и то же слово может употребляться в различном смысле. Кроме того, значения слов повседневного языка обычно зависит не только от их внешней формы, но и то обстоятельств, при которых они высказаны, а иногда и от субъективно-психологических факторов. От обычного, естественного языка, возникшего стихийно и представляющего собой систему знаков и букв, исскуственные языки отличаются тем, что они представляют собой систему знаков, все операции с которыми совершаются по формальным правилам. При разработке исскуственных языков устраняется многозначность слов естественного языка, а также и то, что характеризует наше отношение в различным предметам и явлениям, наши эмоции, волевые побуждения. В исскуствееном языке должны выражаться лишь объективные характеристики объектов и отношений между ними. Информационно-поисковый язык (ИПЯ) - это специализированный исскуственный язык, предназначенный для описания (выражения) центральных тем или предметов и формальных характеристик документов с целью последующего отыскания нужных документов среди множества других -и/или для выражения содержания информационных запросов и поиска нужных документов. Под формальными признаками документа понимается его тип, авторы, название издательства, год и место издательства и т.п. Ни один из естественных языков не может быть применен в качестве ИПЯ. Причиной этого в том, что естественному языку как средству записи информации присущи существенные недостатки. Недостатки эти заключаются в отсутствии однозначного соответствия между содержанием различных текстов и средствами выражения этого содержания. Это несоответствие можно трактовать как избыточность и недостаточность естественного языка. Например, в русском языке величина избыточности достигает 75-85 %. Если в устной речи избыточность служит защитой против речевых помех, то в механизированных и автоматизированных системах избыточность языка является отрицательным фактором, так как приводит к излишней загрузке памяти и уменьшает полноту и точность выдачи информации. Избыточность проявляется в следующем: 1. Для передачи основного содержания сообщения активную роль играют только некоторые слова текста, называемые ключевыми, а остальные слова могут быть отброшены без ущерба для понимания. Язык ключевых слов применяется в реальной жизни при составлении телеграфных сообщений, которые требуют экономии языковых средств. 2. В естественном языке распространены синонимы и близкие по значению слова, что является одним из основных источников неоднозначности выражения одного и того же смысла. 3. Избыточность естественного языка проявляется в возможности выразить одну и ту же мысль ключевыми словами, не являющимися синонимами (перефразировка). Например, "удаление влаги" = "сушка", "повышение производительности труда" = "снижение трудовых затрат". Недостаточность выражений на естественном языке, требующая знания ситуации, к которой относится то или иное сообщение, с точки зрения информационного поиска проявляется в следующем: а)многозначность отдельных слов (омонимия, полисемия); б)эллипсность естественного языка. Под эллипсом понимается пропуск в тексте сообщения отдельных слов, которые подразумеваются. Эллипсы могут быть: - лексические - употребляется сокращенный вариант словосочетания, например, "машина" в смысле "электронная вычислительная машина"; - логико-психологические - не раскрываются логические отношения и психологические ассоциации между словами, употребленными в тексте, и общим языковым фондом. Если лексическая эллипсность довольно легко устраняется по контексту, то для компенсации логико-психологических эллипсов нужно владеть данным языком и знать систему понятий и представлений, относящихся к той области, о которой идет речь. Пусть, например, имеется статья, посвященная вопросам линейного кодирования структурных формул. В этой статье могут отсутствовать слова "автоматизация", "информационный поиск", "химия", но компетентным специалистам известно, что данная публикация имеет непосредственное отношение к проблеме автоматизации поиска химической информации. Именно вследствие логико-психологических эллипсов специальная литература, доступна лишь специалистам, владеющим отраженными в ней понятиями и ассоциациями. Основные требования к ИПЯ сводятся к следующему: 1. ИПЯ должен располагать лексико-грамматическими средствами, необходимыми для точного выражения центральной темы или предмета любого текста и темы любого информационного запроса по данной отрасли науки, техники или практической деятельности. 2. Однозначность - каждая запись на ИПЯ должна иметь один, и только один смысл; и наоборот - любой смысл должен получать единообразное представление на информационно-поисковом языке (отсутствие синонимов, антонимов, омонимов и полисемичных слов); 3. ИПЯ не должен содержать элементов, которые как-то связывают сообщение с автором или адресатом этого сообщения, т.е. как-то характеризируют наше отношение к описываемой ситуации, наши эмоции, волевые побуждения и т.п. 4. Эксплицитное (явное) фиксирование в словаре ИПЯ полезных для поиска логических отношений и психологических ассоциаций между словами ИПЯ (устранение логико-психологических эллипсов); 5. ИПЯ должен быть удобным для алгоритмического сопоставления и отождествления (полного и частичного) поисковых образов документов с поисковыми предписаниями; 6. Возможность корректировки и дополнения, т, е. открытость ИПЯ. Иначе говоря, ИПЯ должен быть гибким, обладать способностью включать новые понятия без коренной ломки принятой структуры; В одной ИПС часто применяется не один, а два различных ИПЯ: один - для индексирования документов, а другой - для индексирования информационных запросов. При разработке ИПЯ необходимо учитывать: - специфику отрасли или предмета, для которого этот язык создается; - особенности текстов (документов), образующих поисковый массив; - характер информационных потребностей, для удовлетворения которых создается данная ИПС. Структурные составляющие ИПЯ В настоящее время существует большое число различных информационно-поисковых языков, их комбинаций и модификаций. Сравнительное изучение различных ИПЯ показало возможность единообразного их описания и анализа. Для этого необходимо выделить основные структурные составляющие плана содержания ИПЯ, которые можно назвать логико-лингвистическими универсалиями информационно-поисковых языков. Универсальными структурными составляющими ИПЯ являются: - алфавит; - лексические единицы; - парадигматические отношения; - синтагматические отношения. Алфавитом называется система графических знаков, используемая для записи (фиксации) слов и выражений какого-либо языка. Алфавитом ИПЯ может включать в свой состав буквы алфавита какого-либо естественного языка (латинского, кириллического и др.,), арабские и римские цифры, знаки пунктуации (точка, запятая, двоеточие, кавычки, дефис, круглые и квадратные скобки, апостроф), знаки арифметических операций (плюс, минус, косая черта, знак процента), знаки отношений (больше, меньше, равно), специальные символы (стрелки, двойное двоеточие) и т.д. Лексическая единица (индекс, слово ИПЯ) - наименьшая осмысленная последовательность знаков, задаваемая при конструировании ИПЯ. Можно сказать, что лексические единицы - это единицы смысла в ИПЯ. Их план содержания соответствует значению отдельного слова или словосочетания естественного языка, либо научному понятию. Совокупность лексических единиц, которыми оперирует ИПЯ, образует лексику. В зависимости от способа задания лексики различают ИПЯ с контролируемой и неконтролируемой лексикой. В ИПЯ с контролируемой лексикой все лексические единицы учитываются в специальном словаре. В качестве таких словарей выступают, например, таблицы классификации УДК и ББК, рубрикаторы, дескрипторные словари. В ИПЯ с неконтролируемой лексикой используется естественный язык, применение которого ограничено (формализовано) введением специальных правил. В отличие от естественного языка, в качестве лексической единицы ИПЯ может выступать не только отдельное слово, но и устойчивое словосочетание, а также фраза, предложение. В соответствии с этим различают уровни интеграции. К первому уровню интеграции относятся ИПЯ, лексическими единицами которых являются преимущественно единичные слова и устойчивые словосочетания, например: бетон, каменный уголь (дескрипторные ИПЯ, фасетные классификации). Вторым уровнем интеграции лексики характеризуются те ИПЯ, лексическими единицами в которых выступают не только слова и словосочетания, но и фразы, имеющие сложную синтаксическую структуру (УДК, ББК, МКИ). Построение лексических единиц ИПЯ может осуществляться двумя способами: 1) использованием в качестве лексических единиц специальных кодов; 2) использованием в качестве лексических единиц слов и словосочетаний естественного языка. В соответствии с этим различают словарные и кодированные ИПЯ. Словарные ИПЯ - это языки, в которых план содержания совпадает с планом выражения естественного языка. Поэтому для лексических единиц этого типа ИПЯ не требуется перевод на естественный язык. Кодированные ИПЯ - языки, в которых план выражения не совпадает с планом содержания. В этих случаях создаются специальные двуязычные словари, позволяющие коды ИПЯ переводить на естественный язык и обратно. Независимо от способа контроля лексики, уровня ее интеграции и способа построения лексических единиц в основе лексики любого ИПЯ лежат термины, так как они являются основными носителями научно-технической информации в текстах документов и запросов. Термины подразделяются в зависимости от сферы применения. При этом в каждой области могут быть выделены специальные (базисные) термины, характерные только для данной сферы; общенаучные термины, отражающие методы, процедуры, средства познания любой предметной области; Термины смежных областей знания, обозначающие необходимые для данной предметной области понятия из смежных отраслей науки и техники. Все эти совокупности терминов находятся во взаимосвязи и не имеют четких границ. Для обеспечения лексической однозначности ИПЯ из его словарного состава необходимо полностью устранить синонимию, омономию и полисемию. Синонимами называются слова разные по звучанию и написанию, но совпадающие по основному значению и употреблению. Лексические синонимы - слова и словосочетания, выступающие в роли взаимозаменяемых элементов высказывания: токсины = яды, экслибрис - книжный знак, избирательное распространение информации = ИРИ. Логические синонимы возникают при логическом определении понятий: Мнемозина - богиня памяти в греческой мифологии, булева алгебра = алгебра логики. Синтаксические синонимы отражают возможность естественного языка выразить одну и ту же мысль речевыми оборотами, т.е. перефразировать: плавание под водой = подводное плавание, план на квартал = квартальный план. Омонимами называются слова, совпадающие по звучанию и написанию, по разные по значению, например: банки (финансовые учреждения) и банки (вид посуды), рысь (млекопитающее рода кошек) и рысь (вид поступательного движения лошади). Полисемией, или многозначностью называются наличие у одного и того же слова нескольких разных, но связанных между собой значений. Так, слово адрес может означать: а) местожительство или местонахождение; б) обозначение местожительства или местонахождения получателя на почтовом отправлении; в) код, определяющий местоположение информации в ЭВМ. В ИПЯ преобладает номинативность над глагольностью, т.е. чаще используются существительные, а не глаголы. Наиболее типичными моделями образования терминов являются следующие: 1) прилагательное + существительное (библиотечные каталоги); 2) существительное + существительное (комплектование фондов, автоматизация библиотек); 3) прилагательное + прилагательное + существительное (интегральные информационные системы). Между лексическими единицами любого ИПЯ, как и между словами естественного языка, существуют определенные отношения, которые обусловлены наличием логических связей между предметами и явлениями, обозначенными этими словами. Такие отношения отражают смысловую связь между понятиями, показывают объективные предметно-логические зависимости между явлениями внешнего мира. Они носят внетекстовой характер и поэтому не зависят от ситуации, для описания которых используются слова. Эти отношения называются парадигматическими (базисными, аналитическими, имманентными) отношениями. Благодаря предметно-логическим связям слова на основе того или иного семантического признака объединяются в лексико-семантические группы, которые называются парадигмами. Например, парадигма хвойные деревья включает ель + кедр + туя. одна и та же лексическая единица может входить в различные смысловые ряды, в которых она противопоставляется по различным смысловым признакам. Например: Река - ручей - речка (размеры водоема) Река - пролив - озеро - море (форма водоема) Река - канал - пруд - водохранилище (характер происхождения водоема). Необходимость отнесения той или иной лексической единицы к различным смысловым рядам (парадигмамО возникает при построении классификационных схем понятий. Принято различать сильные и слабые парадигматические отношения, связывая эти понятия с той ролью, которую эти отношения выполняют для реализации информационного поиска. Сильные парадигматические отношения включают в свой состав отношения тождества и отношения иерархии. Отношения тождества (совпадения, адекватности) как разновидность сильных парадигматических отношений выражаются в использовании синонимов. Отношения иерархии как разновидность сильных парадигматических отношений соответствуют отношениям подчинения. В пределах иерархических отношений различают отношения типа "род-вид" и "целое-часть". По поводу отнесения связи типа "целое-часть" к сильным парадигматическим отношениям не существует единства. Отношение "род-вид" является одним из важнейших видов связей между понятиями. При этом родовым (подчиняющим) называется понятие, выражающее существенные признаки класса предметов, являющихся видами этого рода. Соответственно видовым (подчиненным) называется понятие, которое отображает существенные признаки класса предметов, являющегося видом какого-либо рода. Например, понятия лошадь, корова, овца - видовые понятия, в которых выражены существенные признаки отдельных, качественно особенных, но взаимосвязанных форм животных, входящих в одно родовое понятие домашние животное. Одно и то же понятие может быть (за исключением единичных понятий и предельно общих категорий типа материя, движение, время и т.п.) как видовым, так и родовым одновременно в зависимости от того, по отношению к какому понятию оно рассматривается. Например, понятие аннотация является видовым по отношению к понятию вторичные документы и родовым по отношению к понятию справочная аннотация. Родовидовые отношения, эксплицитно представленные в ИПЯ, позволяют существенно корректировать стратегию поиска по запросам в зависимости от результатов выдачи. В случае "нулевой" или недостаточной выдачи информации по запросу привлечение родовых, вышестоящих терминов позволит расширить область поиска. Основным условием для установления иерархических отношений типа "род-вид" является соблюдение требования: "Все, что можно сказать о роде, можно сказать о виде". Отношение "целое-часть" отражает реальный факт вхождения одного объекта (понятия) в состав другого. При этом подчиняющее понятие соотносится с подчиненными в результате разложения целого на части. Понятия, выражающие части целого, не находятся между собой в отношении соподчинения, что является характерным признаков видовых понятий. Корректировка стратегии поиска может происходить и с учетом парадигматических отношений типа "целое-часть", так как вполне вероятно, что для потребителя информации интересующегося системой, механизмом, процессом в целом, может оказаться полезной информация и об их составных частях, элементах, операциях. Слабые (ассоциативные) парадигматические отношения учитывают логические отношения пересечения понятий и различные психологические ассоциации. Психологические ассоциация возникают в сознании человека, когда представление об одном предмете (процессе или явлении) вызывают у него представление о предметах (процессах, явлениях), связанных с первым по какому-либо существенному признаку. Такие отношения всегда характеризуют совместное участие соотвествующих объектов в типичной для данной области ситуации или участие объектов в аналогичных ситуациях. К разряду слабых парадигматических отношений принято причислять отношения "причины-следствия", "смежности", "контраста". Отношения типа "причина-следствия" характеризует такую ситуацию, при которой одно явление, действие (причина) вызывает, определяет, изменяет или влечет за собой другое явление - следствие. Например, авария-травма, нарушение технологии-брак. Отношение "смежности" является отражением в сознании ассоциативной связи между предметами или явлениями, которые воспринимаются в непосредственной близости друг к другу в пространстве и во времени: болото-торф, ток электрический-напряжение. Отношение контраста (притовоположности) является результатом противопоставления предметов, процессов не по критерию их общности, а по критерию различия. Оно выражается в лексике ИПЯ с помощью антонимов, противоположных по значению слов: экспорт-импорт. Знание и использование парадигматических отношений необходимо для правильного выбора и точного употребления всех слов, которые требуются для передачи какого-либо сообщения, в том числе и для формулирования поискового образа документа или поискового предписания. Поэтому в ИПЯ должны быть выявлены и в явном виде выражены важнейшие парадигматические отношения между словами, которые образуют словарный состав этого ИПЯ. Другим типом отношений, связывающих слова любого языка, в нем имеются также и линейные отношения, уставливаемые непосредственно при объединении слов и словосочетаний во фразы (предложения). Такие отношения получили название синтагматических (синтаксические, текстуальные, грамматические). Синтагматические отношения представляют собой семантические отношения между лексическими единицами, входящими в текст на ИПЯ, т.е. отношения устанавливаемые непосредственно при соединении слов в словосочетания и фразы. Группу лексических единиц, связанных синтагматическими отношениями, образуют синтагму (фразу, предложение на ИПЯ). Если поисковый образ рассматривать как текст на информационно-поисковом языке, то требуется решить две задачи для того, чтобы зафиксировать синтагматические отношения в этом тексте. Во-первых, нужно предусмотреть средства выделения отдельных фрагментов (предложений, фраз), соответствующих законченному высказыванию. Во-вторых, требуется указать смысловую роль лексических единиц, входящих в выделенные фрагменты. Следовательно, грамматические средства ИПЯ можно разделить на два вида: - фрагментирующие; - смыслоразличительные. Фрагментирование может осуществляться: Разделением поискового образа на несколько частей (предложений), вводимых автономно. Указателями связи. Указатель связи (скобки) представляет собой символ (буква, цифра, знак пунктуации), приписываемый всем лексическим единицам, входящим в данный фрагмент. Отдельные лексические единицы могут входить в несколько фрагментов, и следовательно, иметь несколько указателей связи. Фрагментирование не производится. Смыслоразличительные отношения между лексическими единицами одного фрагмента или - в случае нефрагментированного поискового образа - всеми словами текста на ИПЯ могут фиксироваться следующими способами: "Мешочная" грамматика - простое перечисление лексических единиц. В этом случае сам факт присутствия данного набора слов свидетельствует о существовании текстуальной связи между ними, и эта связь может быть более или менее однозначно выявлена, исходя из значения перечисленных лексических единиц. Языки с "мешочной" грамматикой часто квалифицируются как языки без грамматики. Например, когда к тому или иному понятию присоединяется еще одно, поясняющее первое и указывающее на то, что это понятие является именем собственным, определением или видом деятельности. Так, если документ касается изобретателя и его изобретения, то понятия, относящиеся к изобретателю и к устройству, может быть помечены самостоятельно, чтобы избежать путаницы при осуществлении поиска - "дизель" (изобретатель) и "дизель" (двигатель). Позиционная грамматика, заключающаяся в установлении жесткого порядка следования лексических единиц, относящихся к различным информационно-поисковым категориям. Типичным примером позиционной грамматики могут служить фасетные формулы, задаваемые в фасетных классификациях. Указатели роли, представляющие собой вспомогательные индексы, присваиваемые лексическим единицам поискового образа для уточнения их значения. Чаще всего эти списки представляют собой перечни логических категорий, которыми оперирует та или иная область знаний. Указатели способствуют уменьшению объема понятия, обозначаемого лексической единицей. Используются два вида указателей роли: Статистические указатели, представляющие собой численные "весы" ("весовые" коэффициенты), приписываемые лексическим единицам с целью указания их относительной важности для описания смысла сообщения. Функциональные указатели, которые задаются списком, поясняют грамматическую функцию того или иного индекса. Имеют такой вид: 1- исходный продукт 2- конечный продукт............................... 6-воздействующий фактор.................................. 10- метод или средство Поисковые образы, состоящие из одних и тех же лексических единиц, но имеющих различные роли, опознаются при поиске как различные. Например, "каталоги книг" и "каталоги в форме книг". Синтагматические (текстуальные, грамматические, синтаксические) отношения представляют собой смысловые отношения между лексическими единицами. 6
Необходимость создания информационно-поисковой системы (ИПС) нормативно-правового материала не вызывает сомнений. Актуальность машинного поиска правовой информации особенно возросла в связи с развертыванием в нашей стране работ по созданию автоматизированных систем управления (АСУ), причем значительную часть информационного обеспечения составляет законодательный материал. Создание ИПС законодательства, помимо прочих преимуществ, о которых уже говорилось в советской юридической литературе, позволит сократить расходы на проектирование производственных, отраслевых и территориальных АСУ, а также создаст предпосылки, по крайней мере в области кодирования и машинной обработки правовой информации, для их последующей стыковки в единую общегосударственную систему.
Процесс поиска информации условно можно разбить на два этапа. Первый начинается с поступления запроса и заканчивается выдачей адреса документа, например номера статьи и названия акта, в котором она находится. Здесь решаются задачи Юридической семантики. Второй этап начинается с поступления адреса требуемого документа и заканчивается его выдачей. Решаемые при этом задачи к семантике отношения не имеют и целиком относятся к сфере техники.
Как в специальной, так и в юридической литературе системы, обеспечивающие каждый этап раздельно, и системы, обеспечивающие оба этапа вместе, зачастую называются одинаково - информационно-поисковыми. Между тем один и тот же термин употребляется для обозначения разных систем.
Первый этап определяется методом, положенным в основу организации информационного поиска, или, иными словами, языком, в терминах которого осуществляется индексация документов; критерием соответствия найденного документа искомому и алгоритмом поиска адреса - программой реализации критерия соответствия. Это информационно-поисковая система в абстрактном виде, под которой понимается совокупность информационно-поискового языка (ИПЯ) с правилами перевода с естественного языка на ИПЯ и наоборот, а также критерия смыслового соответствия между поисковыми образами правовых актов и поисковыми предписаниями.
В настоящее время для целей информационного поиска используются четыре основных типа информационно-поискового языка: библиотечно-библиографических классификаций, алфавитно-предметной классификации, дескрипторные языки и смешанные языки, объединяющие положительные стороны классификационных и дескрипторных ИПЯ. Необходимость многоаспектного поиска правовых актов, т. е. поиска по любому, заранее не заданному сочетанию признаков, требует использования метода координатного индексирования и основанного на нем дескрипторного ИПЯ.
Но для того чтобы метод координатного индексирования был эффективен, нужно обеспечить единообразное индексирование одинаковых по содержанию документов и информационных запросов, т. е. необходимо устранить такие явления естественного языка, как синонимия, омонимия и полисемия. Осуществить это можно лишь путем установления контроля за употреблением слов и словосочетаний естественного языка, выступающих в качестве ключевых. Такой контроль обеспечивается составлением специального юридического словаря-справочника. Специфика его в том, что ключевые слова в нем сгруппированы в классы эквивалентности, т. е. группы, обозначающие близкие сто смыслу понятия. Из каждой такой группы выбирается одно слово или словосочетание (нормативное слово), которым я обозначается вся группа. Такое нормативное слово принято называть дескриптором, а словарь дескрипторов получил название тезауруса (от греческого thesaurus - сокровищница, кладовая, клад).
Структура тезауруса сочетает признаки классификационных схем и перечней предметных рубрик. Термины его должны располагаться в алфавитном порядке, отражая в то же время иерархические отношения между терминами посредством указания более широких - родовых и более узких - видовых, синонимичных или связанных по значению терминов.
Необходимость в таком словаре возникает вследствие наличия множества слов с неточно определенным объемом значения, что отрицательно сказывается на результатах индексирования и поиска. Правовой тезаурус должен быть единым в масштабах страны или по крайней мере союзной республики с тем, чтобы была возможность последующей стыковки разрабатываемых в настоящее время отраслевых ИПС в области права. Перед нормированным перечнем терминов не стоит задача стандартизации терминологии, он должен лишь устранить встречающиеся в практике терминологические расхождения применительно к разработке и функционированию информационно-поисковой системы.
Точность и определенность юридического языка, отсутствие (за достаточно редким исключением) расплывчатых, двусмысленных и многозначных терминов значительно облегчают задачу создания правового тезауруса. Последнее, однако, не означает, что в юридический информационно-поисковый язык нет необходимости вводить искусственные средства для отражения связей между понятиями.
Перед составителями тезауруса стоит сложная задача - произвести отбор терминов, сгруппировать их в классы и увязать между собой сложные иерархические деревья с тем, чтобы тезаурус обеспечивал удовлетворительную полноту и точность поиска.
Сбор терминов осуществляется путем детального свободного индексирования поискового массива (в машем случае нормативно-правовых актов, составляющих тот или иной институт права).
Для облегчения выделения дескрипторов массив в виде списка ключевых слов разбивается на тематические поля. В массиве по льготному пенсионному обеспечению выделены, например, следующие группы или семантические классы: 1) отрасль промышленности, 2) производство, 3) предприятие. 4) цех, 5) участок, 6) профессия, 7) выходные данные документов.
Дескрипторный язык состоит из нормативных ключевых слов, у которых искусственно, при помощи соответствующих ссылок и знаков устранены синонимия, омонимия, полисемия. Необходимость подобных искусственных преобразований вызвана тем, что вышеперечисленные особенности естественного языка, хотя и сокращенные, но не устраненные полностью в юридическом языке, не позволяют решить задачу однозначного описания смыслового содержания документов, особенно в поисковых предписаниях.
Основа построения дескрипторных информационно-поисковых языков
В основе построения дескрипторных информационно-поясковых языков лежит принцип координатного индексирования, который предполагает, что основное смысловое содержание документа может быть выражено списком ключевых слов. К ключевым словам относятся так называемые полнозначные слова - существительные, прилагательные, глаголы, наречия, числительные, местоимения. Ключевыми словами не могут быть предлоги, союзы, связки, частицы.
Основными элементами ДИПЯ являются:
♦ словарь лексических единиц;
♦ правила применения ИПЯ (грамматика), определяющие процедуру перевода текстов документов и запросов с естественного языка на ИПЯ:
♦ правила построения ИПЯ.
словари лексических единиц делятся на две группы:
♦ основные лексические словари, составляющие лексику ИМЯ;
♦ морфологические словари, обеспечивающие морфологический анализ и нормализацию слов.
В качестве лексических единиц основных словарей используются ключевые слова, словосочетания и дескрипторы.
Дескриптор - понятие, обозначающее группу эквивалентных или близких по смыслу ключевых слов. Дескриптор - это имя класса синонимов. В качестве дескрипторов могут быть использованы код, слово или словосочетание.
Разработка дескрипторного языка фактически сводится к разработке информационно-поискового тезауруса (ИПТ).
Тезаурус (от греч. «хранилище», «сокровищница») в узком смысле представляет собой специальный словарь-справочник, в котором перечислены ключевые слова - дескрипторы определенной предметной области, указаны их синонимы, установлены способы устранения синонимии, омонимии, полисемии, определены родовидовые и ассоциативные связи дескрипторов.
Наиболее важными парадигматическими отношениями ИПТ являются:
♦ соподчинение;
♦ род-вид;
♦ часть-целое;
♦ причина-следствие;
♦ функциональное сходство.
Обобщенная структура ИПТ включает как минимум три составляющих: словарную часть, семантическую карту, руководство по использованию.
Приведем ряд определений.
Словарная часть алфавитный список дескрипторов с их словарными статьями.
Семантическая карта - система тематических классов дескрипторов, представленная в виде графической схемы или таблицы.
Руководство по использованию ИПТ содержит правила перевода ключевых слов и словосочетаний на ИПЯ, правила лексикографического контроля и редактирования ПОД и ПОЗ, а также правила ведения ИПТ.
Отличием информационно-поисковых тезаурусов от информационно-поисковых каталогов на основе предметной иерархической рубрикации является то, что в тезаурусах, помимо классификационной схемы, присутствуют сами ключевые слова и дескрипторы, объединяемые под названием классов, рубрик и т. д. В каталогах же присутствуют только лишь обозначения (названия) классов.
Главная идея информационно-поисковых тезаурусов заключается в повышении эффективности индексирования документов в рамках дескриптивного подхода. Иначе говоря, в системах на основе ПИТ ПОД представлен набором дескрипторов. Однако в процессе индексирования документов учитываются семантические отношения междудескрипторами, что, В конечном счете, обеспечивает более адекватный содержанию документа ПОД и повышает эффективность поиска документов.
Виды ИПЯ
К основным видам ИПЯ относятся: классификационный, предметизационный, дескрипторный.
Классификационный язык
Классификационный язык предназначен для индексирования документов и информационных запросов посредством понятий и кодов какой-либо классификационной системы (ББК, УДК, ГРНТИ, Классификаторов и др.).
В основе классификационных языков лежит систематическая классификация понятий, т.е. классификация, отражающая смысловые отношения между понятиями. Классификационные языки предназначены прежде всего для формализации логических связей слов естественного языка.
РГБ предлагает использовать в ЭК в качестве классификационного языка формализованную и модернизированную ББК в машиночитаемом виде с предметным входом в нее.
Выбор ББК в качестве ИПЯ ЭК, по мнению специалистов РГБ, обусловлен следующими факторами: ББК используется в традиционных каталогах большинства библиотек страны; в предметной классификации отсутствует достаточно развитая для ЭК система смысловых связей между делениями; использование ББК позволяет сохранить в ЭК все достоинства традиционных каталогов, вобравших в себя многолетний опыт библиотекарей и библиографов и привнести новые возможности поиска информации, которые предоставляет вычислительная техника.
А, по мнению канд. пед. наук, зав. отделом НБ РГТУ Л.И. Алешина, ГРНТИ больше приспособлен для автоматизированных технологий, чем ББК.
Все ИПЯ классификационного типа характеризуются рядом свойств, обусловливающих низкую эффективность и затрудняющих их использование в информационном поиске, особенно с применением технических средств. К таким свойствам относятся: предварительная координация (связь) слов и словосочетаний в рубрике, трудность обновления и дополнения, практическая невозможность полной и детальной разработки схемы классификации, трудоемкость использования при индексировании.
Все это привело к созданию языков вербального типа. Эти языки используют для представления своих лексических единиц слова и выражения естественного языка в их орфографической форме. К языкам вербального типа относятся предметизационный и дескрипторный.
Предметизационный язык
Предметизационный язык предназначен для индексирования документов и информационных запросов посредством предметных рубрик. В основе предметизационного языка лежит алфавитный перечень предметных рубрик, представляющих собой краткую формулировку темы на естественном языке. Являясь искусственной системой, предметизационный язык должен быть построен стандартизовано, предельно единообразно. Это помогает читателю сэкономить время и силы.
Дескрипторный язык
Дескрипторный язык служит для координатного индексирования документов и запросов посредством дескрипторов и/или ключевых слов. В основе дескрипторных ИПЯ лежит алфавитный перечень лексических единиц.
Именно дескрипторные языки открыли возможность для автоматизации информационного поиска. Они позволяют достаточно детально и многоаспектно раскрывать содержание документов. Дескрипторы и ключевые слова легко дополняются, обновляются, поскольку в алфавитный перечень можно включить любую лексическую единицу, необходимую для индексирования. Тем не менее дескрипторные языки предназначены для контролируемого индексирования, т.е. для контроля за используемой при индексировании терминологией.
Классификационные и дескрипторные языки отражают две противоположные тенденции во взаимоотношениях между науками и отраслями: дифференциацию наук и их интеграцию.
Нет исследований, обосновывающих ведение нескольких систем индексирования. Но, поскольку каждый из существующих ИПЯ обеспечивает выполнение определенных задач и имеет наряду с достоинствами и недостатки, в ЭК целесообразнее использовать несколько ИПЯ. По мнению специалиста РГБ Е.М. Зайцевой, использование в ЭК нескольких систем индексирования позволяет расширить возможности поиска, совместимости обмена.