Использование машинного обучения для автоматического распознавания структурных элементов научных публикаций

Аннотация: 
Проводится сравнительный анализ применения машинного обучения для автоматического распознавания структурных элементов научных публикаций, с основным фокусом на сравнении машинной модели LSTM (Long Short-Term Memory) с инструментом GROBID, использующим модель Wapiti. Рассматриваются технические характеристики и преимущества каждого метода, а также оценивается их эффективность в контексте точности распознавания структурных элементов. Анализируются результаты экспериментов, проведенных с использованием различных наборов данных, для выявления сильных и слабых сторон каждой модели. Данные для обучения моделей были вручную размечены по структурным элементам в виде тегов, включающих в себя содержание соответствующих элементов.

Ключевые слова: