Алгоритм Леска и система Babelfy для дизамбигуации
Алгоритм Леска и система Babelfy для дизамбигуации
Дизамбигуация является актуальным направлением исследований в сфере теоретической, прикладной и компьютерной лингвистики. В настоящее время задача качественного снятия лексической многозначности не решена, тем не менее, существует ряд подходов к дизамбигуации. В статье описан эксперимент по анализу работы систем разрешения лексической многозначности – алгоритма Леска и системы Babelfy. Системы, выбранные для работы, основаны на разных подходах к дизамбигуации. Алгоритм Леска работает на пакете библиотек и программ NLTK, Babelfy - на основе семантической сети Babelnet. Тестирование проводилось с использованием собранной выборки предложений, содержащих многозначные слова, фразовые глаголы, омонимы, другие неоднозначные лексические единицы. В ходе исследования проводился анализ качества работы систем, для каждой из них представлен коэффициент эффективности. В соответствии с проведенным статистическим анализом ошибок можно сделать вывод о недостаточно высоком качестве работы систем снятия многозначности. В заключении описаны возможные причины ошибок систем дизамбигуации и предложено решение по их улучшению.
Гаджиев А. А., Хмелёв А. К. Алгоритм леска и система babelfy для дизамбигуации // Вопросы прикладной лингвистики. № 36. С. 54-77. https://doi.org/10.25076/vpl.36.03
ВПЛ No. 36
Подходы к языковому и акустическому моделированию в распознавании речи
Лингвопрагматика немецких музыкально-поэтических текстов
Алгоритм Леска и система Babelfy для дизамбигуации
Гендерные особенности детской анимации (проблемы перевода на примере «Kikoriki» и «Gogoriki»)
Язык интернета 2015-2018 годов: основные особенности