Часть полного текста документа:nOCIPOFHHE СИСТЕМ ДИСКРЕТНОГО РАСПОЗНАВАНИЯ РЕЧИ, РАБОТАЮЩИХ БЕЗ ПОДСТРОЙКИ ПОД ДИКТОРА § 2.1. Общие проблемы автоматической подстройки неадаптивных систем распознавания речи Ьеадаптивные системы дискретного распознавания речи, рассматриваемые в настоящей главе, позволяют произвольному диктору-ногитедю нормы произношения данного языка производить автоматический речевой ввод изолированными словами или короткими спиво-сочетанияуи. Такие системы являются, как правило, аппаратурно-ц рог равным и и основываются на выделении некоторых устойчивых фонетических признаков, проявляццихся у множества дикторов-носителей нормы данного языка для различных классов звуков,и на дальнейшем использовании этих признаков (представленных гистограммами их распределения) для декодирования высказывания. Однако фактически и в этих системах осуществляется некая подстройка под множество дикторов (обучение) во время сбора статистики, построения гистограмм параметров для различных звуков и при выборе решающих правил. Поэтому, строго говоря, такие системы не следовало бы называть неадаптивными, т.е. термином, достаточно широко распространенным в настоящее время. Кроме того,автоматическое разбиение всего множества дикторов-пользователей на группы (кластеры) и формирование обобщенных эталонов слов дяя каждой группы само по себе есть обучение на диктора, адаптация универсальной системы к этому множеству пользователей,что также заставляет быть осторожным в применении Термина-"неада^тивные", Если же говорить об использовании этого термина в смысле отсутствия адаптации к новому словарю и языку системы, го, действительно, все известные невдаптивные системы [10, 16,25, 166, 167] практически не обеспечивав автоматическое изменение этих основных характеристик. Попытка универсальной сегментации слов, яв-хякхцейся основой подстройки иод словарь, рассмотрена в [133 • Задача настоящей главы - исследовать более широкие аспекты проблемы перестройки к новым условиям не адаптивных систем, ориентированных на работу с произвольным диктором. Под адаптацией будем здесь понимать расширение, развитие неадаптивной системы автоматического распознавания фраз, составленных мэ изолирований 74 йдов, эа счет некоторого изменения языка этой системы и его словарного состава. Как правило, в конкретных задачах речевого управления возникают Проблемы, связанные с обогащением языка, добавлением новых слов и понятий. В отдельных случаях требуется медиком заменить словарный состав языка, приспособить системы к совершенно новой задаче. При этом желательно сохранить основные структурные (синтаксические) свойства языка, связи между лингвистическими уровнями, соотношения между понятиями внутри уровня, т.е. придать свойствам языка универсальный характер, формализовать язык речевого запроса таким образом, чтобы он напоминал язык опи-оанйя баз данных - сетевой, иерархической или реляционной. Основными лингвистическими вопросами, возникгшцими при этом, явжявтся: 1) как оценить сложность языка речевого общения и попытаться, используя синонимию, свести трудности распознавания сдов, вызванные фонетическими неопределенностями, до минимума; 2) каким образом ограничить гибкость проблемно-ориентнрова!:-иого языка, не слыпком сдерживая желания и возможности человека общаться с информационной системой естественными фразами; какие задачи позволяют нам практически использовать относительно простой синтаксис языка; 3) как автоматически расширять словарный запас языка; 4) как при этом корректировать язык, на базе которого создана неадаптивная система автоматического распознавания. (Вопросы о расширении круга пользователей, включая пользователей, говорящих с акцентом иди дефектом речи, а также проблемы поиска новых информативных признаков, использования телефонного канала опускаем, относя их к техническим вопросам,которые • работе не рассматривается.) Некоторые из перечисленных лингвистических проблем возникают и для адаптивных систем, работающих с подстройкой под дик-Юра и словарь. ............ |