IBM объявила о добавлении новых функций обработки естественного языка в Watson Discovery — платформе для поиска и анализа текста, которая может извлекать важную информацию, скрытую в корпоративных данных. Добавленный функционал включает автоматическое распознавание структуры документов и текстовых шаблонов.
Обновление Watson Discovery включает следующие улучшения:
- Предобученная модель понимания структуры документа. Функция интеллектуального понимания документов Watson Discovery теперь включает новую предобученную модель, предназначенную для автоматического понимания визуальной структуры и макета документа без дополнительной подготовки разработчиком или специалистом по обработке данных.
- Автоматическое обнаружение текстовых шаблонов. Новая функция создания шаблонов позволяет пользователям быстро определять бизнес-специфичные текстовые шаблоны документах. Функция может определять базовые текстовые шаблоны всего на двух примерах, а затем улучшать их на основе отзывов пользователей.
- Расширенные возможности кастомизации обработки естественного языка. С помощью новой функции извлечения пользовательских признаков IBM упрощает процесс обучения NLP-моделей для идентификации высоконадежных, специфичных для бизнеса ключевых слов за счет сокращения усилий по подготовке данных, упрощения аннтотирования с помощью активного обучения и массового аннотирования, а также позволяет упростить развертывание моделей для ускорения времени обучения.