Новая модель машинного обучения позволит ИИ понимать человеческий диалог
Человеческий разговор динамичен, со многими исключениями и неожиданными способами самовыражения. В последние годы был достигнут значительный прогресс в том, чтобы помочь системам машинного обучения овладеть даже самыми элементарными знаниями о средствах связи. В то время как взаимодействие человека с машиной находится в центре внимания нынешних исследований диалога, именно человеческое общение является самым большим препятствием для понимания устной речи.
Исследователи из Центра обработки речи и языка Джона Хопкинса разработали модель машинного обучения, позволяющую различать речевые функции в стенограммах диалогов, создаваемых системами понимания языка. Успех в данных исследованиях может помочь компьютерам «понимать» устный или письменный текст так же, как это делают люди.
Новая модель распознает смысл слов в окончательной расшифровке стенограммы и классифицирует их как «Утверждение», «Вопрос» или «Прерывание» в рамках задачи, известной как «распознавание диалогового акта». Благодаря этому модель может стать мостом в понимании человеческого разговора.
При представлении больших неструктурированных фрагментов текста системы понимания языка не могут классифицировать такие факторы, как тема, настроение и смысл текста. Некоторые ранее установленные модели понимания языка были адаптированы для упорядочивания и категоризации слов и фраз. Кроме того, команда проанализировала, как различные переменные, такие как пунктуация, влияют на производительность этих моделей. Как было обнаружено, пунктуация дает важные подсказки моделям для понимания текста.
Большинство алгоритмов обработки естественного языка (Natural Language Processing, NLP) работают хорошо только тогда, когда текст имеет четкую структуру, например, при наличии целых предложений. Однако в реальной жизни люди редко общаются формально, из-за чего алгоритмам сложно определить, где начинается и заканчивается фраза.
Новая модель может оказаться полезной в различных сферах, например, для медиков, помогая им сэкономить время, затрачиваемое на ведение записей при работе с пациентами. Они могут использовать этот подход, чтобы автоматически читать стенограмму разговора, заполнять документы и делать заметки.