Аттестационная комиссия
Комиссия по аккредитации
Комиссия по экспертов
Распоряжения, инструкции
Нормативные акты
Номенклатура
Организации
Ученые советы
Семинары
Диссертации
Научные руководители
Ученые
Докторанты
Постдокторанты
CNAA logo

 română | русский | english


Расширяемые средства синтаксическо – семантической интерпретации текстов на естественном языке


Автор: Creţu Sergiu
Степень:доктор физико-математических наук
Специальность: 01.05.04 - Математическое моделирование, математические методы, программное обеспечение
Год:2007
Научный руководитель: Dumitru Todoroi
доктор хабилитат, профессор
Научный консультант: Anatol Popescu
доктор хабилитат, профессор, Технический Университет Молдовы
Институт:
Ученый совет:

Статус

Диссертация была зашищена 23 ноября 2007
Утверждена Национальным Советом 20 декабря 2007

Автореферат

Adobe PDF document0.29 Mb / на румынском

Диссертация

CZU 004.822(043)

Adobe PDF document 0.90 Mb / на румынском
134 страниц


Ключевые слова

База знаний, лингвистическая компетенция, лингвистический корпус, глосса, искусственный интеллект, синтаксическо – семантическая интерпретация, формальный язык, естественный язык, синтаксис, семантика, денотационная семантика, семантическая сеть, расширяемые средства.

Аннотация

Докторская диссертация представляет результаты исследования приципов и методов разработки системы синтаксическо – семантической интерпретации (ССИ) текстов на естественном языке (ЕЯ).

Под ССИ текстов на ЕЯ понимается процесс анализа и извлечения информации содержащаеся в текстах на ЕЯ, осуществленного в точно определенном семантическом контексте, обеспеченного адекватной базой знаний.

Результатом ССИ текстов на ЕЯ является система объяснений – глоссы – фрагменты текстов на ЕЯ, что и составляет синтаксическое и семантическое объяснение интерпретироианного текста.

Исследоваиие проблемы обусловлено необходимостью обработки больших объемов иформации, представленной в виде текстов на ЕЯ, главным образом, предосталенной существующими вычислительными сетями (глобальными или локальными).

Были разработаны принципы создания системы ISS – GLOS для синтаксическо – семантической интерпретации (ССИ) текстов на естественном языке (ЕЯ). Система ISS – GLOS позволяет эффективно идентифицировать информацию, содержащаяся в текстах на ЕЯ (вручную, посредством разработаного для этого формального языка LBC или автоматизировано) и ее интерпретацию в виде глосс. Доступ, модификация и удаление информации из базы знаний осуществляется в рамках той же системы.

Значение данной работы состоит в разработке теоретических и практических предпосылок для создания эффективных сред для хранения информации с существенным сематическим наполнением, какими являются тексты на ЕЯ с поледующим ее использованием для синтаксическо – семантической интерпретации текстов на естественном языке.

В данной работе получены следующие результаты:

  1. Разработана аксиоматическая модель для представления информации, содержащаяся в текстах на ЕЯ, полученная посредсвом интерпретации грамматических категориий с целью ССИ текстов на ЕЯ. На основе данной модели были сформулированы требования к базе знаний, необходимой для присваиваиия смысла интерпретированному тексту. Синтезироваие смысла анализированого текста основывается на морфологической, синтактической и семантической информации данного текста;
  2. На основе синтаксической, семантической и прагматической информации сформулировано понятие ССИ текстов на ЕЯ и была уточнена структура базы знаний. Для администрирования базы знаний был разработан формальный язык LBC. Основой для данного языка послужила аксиоматическая модель представления информации содержащаяся в текстах на ЕЯ.
  3. Разработана интерпретационная модель присваивания смысла текстам на ЕЯ. Определена семантическая транслирующая сеть переходов (СТСП) в качестве инструмента ССИ текстов на ЕЯ. Для алгоритмизации ССИ текстов определено понятие семантического транслятора со стеком. Была доказана теорема фунциональной эквивалентности СТСП семантическому транслятору со стеком. Для повышения надежности ССИ текстов на ЕЯ была предложена недетерминистская модель интепретации. В связи с этим СТСП были дополнены понятием взвешенности (ВСТСП).
  4. Для представления результата ССИ текстов на ЕЯ были сформулированы два тезиса, которые указывают что полученный результат интерпретации описывается мульти – сорт алгеброй, а присваиваиие смысла синтаксическим конструкциям может быть сведено к гомоморфизмам определенными алгебраическими производными. Разработана схема представления результатов ССИ текстов на ЕЯ, основаная на денотационных принципах.
  5. Для поддержки целостности базы знаний было разработано множество операций и сформулирована концепция виртуального словаря – метод организации и расширения базы знаний.
  6. Было уточнено понятие глоссы в качестве конечного результата ССИ текстов на ЕЯ.

Полученные результаты могут служить основой для исследований в области ССИ текстов на ЕЯ а также для разработки методов эффективного хранения информации со значительным семантическим наполнением.