Контент

Для ознакомления

Оглавление

ПРЕДИСЛОВИЕ 10
ВВЕДЕНИЕ 12
ГЛАВА 1. NEW MEDIA 15
ГЛАВА 2. ПОИСК В INTERNET 43
ГЛАВА 3. СИСТЕМЫ ИНТЕГРАЦИИ INTERNET-КОНТЕНТА 87
ГЛАВА 4. XML - ЯЗЫК РАЗМЕТКИ И МОДЕЛЬ ДАННЫХ 141
ГЛАВА 5. ОСНОВЫ ТЕХНОЛОГИИ TEXT MINING 159
ГЛАВА 6. ИНСТРУМЕНТАРИЙ КОНКУРЕНТНОЙ РАЗВЕДКИ 217
ГЛАВА 7. ЗАКОНОМЕРНОСТИ, ПРИСУЩИЕ
      ИНФОРМАЦИОННЫМ СИСТЕМАМ 231
ГЛОССАРИЙ 252
ЛИТЕРАТУРА 262
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 266

 Содержание

 Введение

 Предисловие

 Часть главы


 Статьи автора, обобщенные в книге 

Поле боя - семантика
Сегодня информационные ресурсы Сети составляют свыше десятка миллиардов документов (Web-страниц), к которым возможен свободный доступ любого пользователя. Естественно, для того, чтобы найти необходимую информацию и этой крупнейшей распределенной полнотекстовой базе данных необходимо использовать самые мощные ИПС. Такие системы существуют и конкурируют друг с другом на современном рынке информационных технологий.
Подробнее >>

Text Mining
Попытки анализа больших объемов неструктурированных или слабо структурированных данных очень часто усложняют процесс принятия решений. Если широкий спектр поисковых систем достаточно легко справляется с "простым" полнотекстовым поиском, то для подобного анализа нужны технологии совсем другого типа, представленные системами добычи знаний.
Подробнее >>

Новостной Интернет
Для решения задачи синдикации новостей было создано несколько форматов описания данных на основе XML. Самый распространенный формат получил название RSS, что означает Really Simple Syndication, Rich Site Summary, хотя изначально он назывался RDF Site Summary. Смысл всех этих аббревиатур заключается в простом способе обобщения и распределения информационного наполнения Web-сайтов - синдикации контента.
Подробнее >>

Система InfoStream®

При непосредственном участии автора и под его научным руководством в ElVisti создана система InfoStream®, с помощью которой охватываются новости из тысяч Web-сайтов, осуществляется их обработка и обобщение. Сервисы, построенные на основе Infostream, обеспечивают пользователям одновременный доступа в режиме поиска к информации из многих Web-сайтов, предоставляют возможность смысловой обработки и, вследствие этого, минимизацию усилий на получение необходимых данных из Интернет.

Методическое пособие


P e к л а м a: