Федеральное государственное автономное образовательное учреждение
высшего профессионального образования
"Уральский федеральный университет
имени первого Президента России Б. Н. Ельцина"
Секция информатизации библиотечного дела
Реферат на тему:
Компьютерный анализ текста
Исполнитель: Жданова Юлия Сергеевна,
студентка группы ИТ-47021
Научный руководитель: Гришина С. М., доцент.
Екатеринбург 2010
Оглавление
Введение
Глава 1. Анализ текста
Глава 2. Компьютерный анализ текста
2.1 Понятие компьютерного анализа. История развития
2.2 Проблемы компьютерного анализа текста
2.3 Извлечение информации
2.4 Обработка естественного языка
Глава 3. Программы для компьютерного анализа текста
3.1 Машинный перевод
3.2 Лингвистическое программное обеспечение
3.3 Программы для компьютерного анализа текста
Заключение
Библиографический список и сайтография
Введение
Компьютерный анализ текста на естественном языке активно развивается в последние годы многими коллективами. Доступные сегодня вычислительные мощности позволяют применять для обработки больших массивов документов широкий класс математических методов, способствующих эффективному решению задач поиска, классификации, кластерного анализа, выявления скрытых закономерностей в данных и др.
К сожалению, внедрение математических методов в обработку текста происходит в то время, когда собственно лингвистическая составляющая алгоритмов представлена явно недостаточно, и это не позволяет достичь высокого качества работы прикладных систем. Устойчивый уклон в область статистических методов анализа привел к тому, что компьютерная лингвистика оказалась невостребованной. В самом деле, во всех известных русскоязычных системах подобного класса из лингвистического обеспечения используется лишь морфологический словарь, позволяющий отождествлять различные словоформы, тогда как алгоритмы синтаксического анализа реализованы исключительно в автоматических переводчиках и вызывают множество нареканий в связи с невысокой точностью.
Цель, которую поставила перед собой автор данной работы – это выяснить, что такое компьютерный анализ текста.
При этом необходимо решить следующие задачи:
- ознакомиться с понятием анализ текста;
- рассмотреть, что понимается под компьютерным анализом текста;
- ознакомиться с историей развития компьютерного анализа текста;
- выявить проблемы компьютерного анализа текста;
- привести некоторые программы, используемые при компьютерном анализе текста.
Глава 1. Анализ текста
Анализ (греч. "analysis" – разложение) – метод научного исследования (познания) явлений и процессов, в основе которого лежит изучение составных частей, элементов изучаемой системы.
Аналитические методы широко распространены в социуме, поэтому термин "Анализ" часто воспринимается как синоним исследования вообще и особенно при решении познавательных задач. Анализа является составной частью любого научного исследования, образуя, как правило, его первую стадию, когда исследователь выявляет в описании изучаемого объекта его строение, состав, свойства, признаки и т.п. Он используется как метод получения новых результатов в процессе мыслительной деятельности человека.
Мыслительный анализ совершается с помощью понятий и суждений, выражаемых в естественных или искусственных языках. ............