В статье представлена базовая процедура для интеграции двух лексических ресурсов - RussNet и YARN - с целью получения большого открытого компьютерного лексикона для русского языка. Основной проблемой, решаемой при интеграции, является неопределенность границ основных единиц тезаурусного описания, называемых в традиции wordnet-словарей синсетами. Такие единицы содержат лексические компоненты (слова и словосочетания), являющиеся смысловыми эквивалентами, что традиционно определяется как отношение синонимии. Однако трактовка этого отношения несколько отличается в структурах RussNet и YARN. Описываются методы объединения синсетов двух тезаурусов.
Переведенное названиеIdentification of Thesaurus Units in the Process of Integration RussNet and YARN
Язык оригиналаРусский
Название основной публикацииСтруктурная и прикладная лингвистика : К 60-летию отделения прикладной, компьютерной и математической лингвистики СПбГУ
Подзаголовок основной публикациимежвузовский сборник
Место публикацииСанкт-Петербург
ИздательСанкт-Петербургский государственный университет
Страницы34-52
Число страниц19
ТомВыпуск 12
СостояниеОпубликовано - 2019

    ГРНТИ

  • 16.00.00 ЯЗЫКОЗНАНИЕ

ID: 11276335