Часть полного текста документа:Московский Государственный Университет Путей сообщения (МИИТ) Кафедра АСУ Курсовой проект "Разработка программных средств конвертирования HTML текстов в семантическую сеть" Выполнила: Студентка 5-го курса группы УИС-511 Болотова Е.А. Проверил: Саркисян Р.Е. Москва 2001 Содержание: Что такое семантическая сеть ................................3 Основные сведения о языке HTML .........................3 1.Введение .................................................3 2.Сруктура HTML-документа ..........................4 Что такое фреймы ..............................................7 Возможности представления знаний на базе языка HTML ......................................................8 TextAnalyst 2.0 - персональная система автоматического анализа текста .............................14 Принцип работы HTML-конвертора ........................17 Список использованных источников .......................21 Что такое семантическая сеть Семантическая сеть - структура для представления знаний в виде ориентированного графа, в котором вершины - это понятия, а дуги - отношения. Термин семантическая означает "смысловая", а сама семантика - это наука, устанавливающая отношения между символами и объектами, которые они обозначают, что есть наука, определяющая смысл знаков. Самые первые семантические сети были разработаны в качестве языка-посредника для систем машинного перевода. Однако последние версии семантических сетей стали более мощными и гибкими и составляют конкуренцию логическому программированию, фреймовым системам и другим языкам представления. На сегодняшний день существует множество вариантов семантических сетей. Их терминология и структура различаются, но существуют сходства, присущие всем семантическим сетям: 1. Узлы семантических сетей представляют собой концепты предметов, событий, состояний 2. различные узлы одного концепта относятся к различным значениям, если они не помечены как относящиеся к одному концепту 3. дуги семантических сетей создают отношения между узлами-концептами (пометки над дугами указывают на тип отношения) 4. некоторые отношения между концептами представляют собой лингвистические падежи, такие как агент, объект, реципиент и инструмент (другие означают временные, пространственные, логические отношения и отношения между отдельными предложениями 5. концепты организованы по уровням в соответствии со степенью обобщенности так, как, например, сущность, живое существо, животное, плотоядное. Несмотря на некоторые различия, сети удобны для чтения и обработки компьютером, а также достаточно мощны, чтобы представить семантику естественного языка. Наиболее часто в семантических сетях используются следующие отношения: - связь типа "часть-целое" ("класс-подкласс", "множество-подмножество" и т.п.) - функциональные связи, определяемые обычно глаголами "производит", "принадлежит" и т.п.) - количественные ("больше", "меньше", "равно" и т.п.) - пространственные ("близко от", "далеко от" и т.п.) - временные ("раньше", "позже" и т.п.) - логические связи ("и", "или" и т.п.) - лингвистические связи и т.д. Основные сведения о языке HTML 1. ............ |