Часть полного текста документа:Разработка компьютерной языковой системы обучения японскому письму с использованием техники обработки естественного языка: Изучение страдательного залога. Jie Chi YANG, Kanji AKAHORY Эта работа описывает разработку компьютерной языковой системы обучения (computer assisted language learning system- CALL-система) японскому письму с использованием техники обработки естественного языка (natural language processing - NLP-техника). Эта система может быть использована при письме для изучения японского страдательного залога с помощью WWW. Для выявления типов ошибок, возникающих при написании страдательного залога японского языка у студентов-иностранцев, авторы проводили тест и делали обзор вопросника. В результате этих исследований авторы классифицировали типы ошибок в японском страдательном залоге на 12 категорий, 65 видов и 228 ошибок. Эта классификация используется для анализа ошибок, проводимого системой. В этой системе авторы используют средства NLP (включая анализатор морфем и синтаксический анализатор), а затем добавляют анализ ошибок и обработчик обратной связи. Таким образом, система, давая обучаемому возможность свободно вводить предложения, может обнаружить ошибку в напечатанных (введенных обучаемым с клавиатуры) предложениях и выдавать обучаемому адекватные сообщения обратной связи. Кроме того, авторы предлагают механизм исправления обучаемым, позволяющий обучаемому корректировать напечатанные предложения самому, что поможет ему лучше понять те ошибки, которые он совершил. Этот механизм может быть рассмотрен как дополнение к блоку прогнозирования системы и как усиление эффективности данной CALL-системы. Введение Эффективность CALL-систем была описана многими учеными [4],[7]. Недостатком существующих CALL-систем является то, что обучаемый не может свободно вводить с клавиатуры заданные языковые выражения, особенно это относится к компьютерным системам обучения письму. Обучаемому доступна лишь информация, сопровождающая правила учебного курса, заранее установленного на компьютер. Поэтому нельзя назвать такой тип систем полностью интерактивными. В результате этих причин проводится все больше и больше исследований [1],[3],[7]в области применения NLP-техники в CALL-системах. Исследования [2],[5],[9] анализа ошибок в системах обучения письму были особенно усилены превосходными результатами эксперимента [6] в области выносливости (устойчивости к ошибкам) средств NLP. В CALL-системах анализ напечатанных предложений является необходимостью, так как обучаемый должен иметь возможность свободно формулировать предложения без каких-либо предописанных правил. Поэтому мы используем средства NLP для анализа напечатанных предложений. К сожалению, почти все теории грамматики и техника NLP, предложенные до сегодняшнего дня могут анализировать только грамматически корректные предложения. Однако обучаемые японскому языку, использующие CALL-систему, скорее всего, напечатают неправильные предложения. Таким образом, мы можем или добавить анализатор ошибок в существующие, нескорректированные NLP-средства, или скорректировать NLP-средства для решения этой проблемы. В этой статье мы применили первый метод. Однако, это сопряжено с проблемой неопознания правильной морфемы или правильной части речи слова. Трудность заключается в обнаружении правильных морфем даже в грамматически корректных предложениях, так как в японском языке предложения пишутся непрерывно, без каких-либо промежутков1. ............ |