Фрактальный анализ тематических информационных потоков

Ландэ Д.В., к.т.н., Григорьев А.Н., Брайчевский С.М., к.ф.-м.н.
Информационный центр "ЭЛВИСТИ"

В то время, как для анализа традиционных средств научной коммуникации фрактальный подход используется уже достаточно широко (труды Ван Раана [2], С.А. Иванова [3]), информационные потоки в Интернет [1] до последнего времени не рассматривались с этой точки зрения, что связано с проблемами их идентификации как фрактальных множеств.

Объемы сообщений в тематических информационных потоках образуют временные ряды, которые могут рассматриваться как стохастические фракталы. Этот подход расширяет область применения теории фракталов, которая рассматривается как статистический инструментарий, позволяющий получать важные характеристики информационных потоков, не вдаваясь в детальный анализ их внутренней структуры.

Сегодня становится популярной такая характеристика временных рядов, как показатель Херста (H), который связывают с коэффициентом нормированного размаха (R/S), где R - вычисляемый определенным образом "размах" соответствующего временного ряда, а S - стандартное отклонение. Е. Федер [4] установил, что показатель Херста связан с фрактальной размерностью (D) простым соотношением: D + H = 2. Херст экспериментально обнаружил, что для многих временных рядов справедливо: R/S = (N/2)^H, где N - число точек наблюдения.

В качестве экспериментальной базы для исследования фрактальных свойств авторами использовалcя документальный корпус системы мониторинга новостей из ╤нтернет InfoStream, которая в настоящее время охватывает свыше 40000 уникальных новостных сообщений в сутки.

Тематики исследуемых информационных потоков определялись запросами к системе InfoStream. Для разных тематик значения показателей Херста составили от 0,58 до 0,96, что свидетельствует о высокой персистентности исследуемых временных рядов и четко детерминирует различные тематики.

Полученные данные подтвердили предположение об итеративности процессов в информационном пространстве. Републикации, цитирование, прямые ссылки порождают самоподобие, проявляющееся в устойчивых распределениях и эмпирических законах.

Литература

1. Современные информационные потоки: актуальная проблематика / С.М. Брайчевський, Д.В. Ландэ // Научно-техническая информация. Сер. 1, 2005. - N 11. - С. 21-33

2. Fractal geometry of information space as represented by cocitation clustering / Van Raan A. F. J. // Scientometrics. -1991. - Vol. 20, N 3. - Р. 439-449.

3. Стохастические фракталы в Информатике / Иванов С.А. // Научно-техническая информация. Сер. 2, 2002. - N 8. - С. 7-18

4. Федер Е. Фракталы / -М.: Мир, 1991, -254 с.


P e к л а м a:
[an error occurred while processing this directive]