ЗА ЗНАНИЯМИ - К ВИКИПЕДИИ

                                  

Дмитрий ЛАНДЭ

Часть 1. История и идеология

Старые идеи основателей WWW

Сегодня использование Web-пространства для получения необходимой информации, знаний достаточно проблематично. Действительно, традиционный Web переполнен неструктурированными ресурсами, поисковые системы не могут или не успевают охватить все, что требуется, "скрытый" Web, не охватываемый поисковыми системами живет своей жизнью, а перспективная идея семантического Web находится пока в младенческом состоянии.

Как же ищут знания в Сети сегодня? Пользователь, который кое-что знает о поисковых системах, придумывает запрос и обращается с ним к наиболее популярным поисковым серверам, таким как Google, Yahoo, Яндекс, после чего долго и упорно листает десятки и страниц с формально релевантными, но не всегда действительно нужными ему результатами.

Т.е. так, как задумывался отцами-основателями Web'a не получилось, вместо "глобальной базы знаний" или "коллективного разума", продукта совместного творчества пользователей Сети, сегодня создан глобальный информационный хаос. Поэтому задача доступности необходимой пользователю информации в режиме он-лайн и еe оперативного изменения сегодня актуальна как никогда ранее.

Вместе с тем, в Интернет существуют, пусть как редкие исключения, проекты, которые реально воплощают в себе мечты создателей Web. Один из таких проектов - это "народная энциклопедия" - Википедия (www.wikipedia.org). Сегодня - это действительно интерактивный продукт совместного творчества. Википедия достаточно точно соответствует той концепции WWW, которая задумывалась, в частности, Тимом Бернерс- Ли (Tim Berners-Lee). Википедия это самая большая из бесплатных он-лайн библиотек в Internet, самая динамичная, самая обновляемая, самая доступная для обновлений, однако, не самая надежная, что объясняется ее идеологией, о чем пойдет речь ниже. Коллективное документирование

Название Википедия произошло от слов "вики" и "энциклопедия", а слово вики, в свою очередь, - от гавайского слова "wikiwiki" - "как можно быстрее". Технология Вики, на которой базируется Википедия, родилась уже 10 лет назад как подход к коллективному ведению софтверных проектов, поддержания в должном порядке развития технических заданий и спецификаций. Основная идея вики-технологии состоит в обеспечении возможности коллективной работы с документами - любой документ из электронной библиотеки подлежит редакции любым пользователем - в открытых Web-системах любым пользователем из Internet, в корпоративних применениях - любым пользователем корпоративной сети.

Во многом Вики напоминает Open Source (открытый код), и даже лицензионный режим у них сходный, однако Вики служит для создания не программного обеспечения, а контента - в первую очередь, текстов. Вместе с тем, с помощью вики-систем, как выяснилось, можно успешно разрабатывать программное обеспечение коллективного авторства

Вики-системы - это Web-сайты, работающие по принципу Вики, т.е. которые можно не только читать, но и изменять в режиме он-лайн. Такие сайты имеют свободную, вручную создаваемую структуру: отдельные страницы и статьи связываются гиперссылками. Существует достаточно много программ различных производителей, реализующих идеологию вики. Это достаточно не связанные программы, предоставляющие даже различный синтаксис разметки документов, начиная от HTML (как самого сложного варианта), и заканчивая оговоренными правилами, которые порой трудно даже назвать языком, однако которые удобны для узкой задачи - создания документа для размещения в вики-среде, оформительский дизайн при этом отходит на второй план. Чаще всего синтаксис Вики задает простой, практически не требует особой разметки, вариант редактирования, в котором участники могут даже не использовать HTML, чтобы создать свои Web-страницы. Сегодня большинство вики-систем размещаются на публичных серверах и являются объектом информационного вклада любого посетителя. Википедия применяет специальный синтаксис, отличающийся особенной простотой и прозрачностью.

Сетевые энциклопедии

В Сети постоянно происходят попытки сбора и систематизации рафинированных знаний, накопленных человечеством за века.

Слово "энциклопедия" вошло в обиход в XVIII веке благодаря деятельности французских просветителей Дидро и д'Аламбера, написавших 28 тома труда "Энциклопедия, или толковый словарь наук, искусств и ремесел". "Энциклопедия" стала первым коллективным трудом многих европейских ученных, создававших статьи путем активной переписки с редакцией.

Конечно же, в настоящее время существуют сотни и тысячи энциклопедий, в том числе и электронных. При этом большая часть авторитетных энциклопедий являются платными, при этом бумажные издания в десятки раз дороже электронных, представленных на CD/DVD. В свободном же доступе находятся как правило устаревшие или ограниченные версии, например, "Британника" 1911 года (http://1911encyclopedia.org) или Microsoft Encarta (4,5 тысячи статей из 60 тысяч). В России Яндекс дает доступ к Бобьшой советской энциклопедии 1978 года и Словарю Брокгауза и Ефрона 1907 года. Мегаэнциклопедия Кирилла и Мефодия (mega.km.ru) практически представляет собой электронную версию Современного Энциклопедического словаря 1997 года. Достаточно актуальная энциклопедия "Кругосвет" (krugosvet.ru) содержит лишь около 10 тысяч статей.

У электронных сетевых энциклопедий есть одно неоспоримое преимущество перед традиционными бумажными энциклопедиями, в которых все допущенные ошибки остаются до следующего "исправленного и дополненного" издания. Один недостатков традиционных энциклопедий заключается также в низком уровне оперативности - они создаются очень медленно, но устаревают достаточно быстро. К примеру, для обеспечения актуальности "Британника" в ней каждые два года переписывается 35% статей. Вместе с тем, наметились в явном виде тенденции к созданию открытых "народных" энциклопедий. Например, недавно компания Microsoft объявиля, что компанией ведется работа над тем, чтобы информацию в Encarta мог редактировать любой желающий. Предполагается, что в недалеком будущем каждый посетитель сайт Encarta сможет предложить редакторам свое уточнение или дополнение к размещенным в энциклопедии материалам. При этом за редактором останется право приема или отклонения предложенных исправлений. Автор статей при этом будет обязан представить ссылку на источник, подтверждающий верность предлагаемой информации.

Сегодня определенной критической отметки достигли онлайновые энциклопедии, к которым доброжелательно относятся даже в научном мире. К таким проектам относится, прежде всего, Википедия, которой посвящена данная статья, но не только. В качестве примера можно назвать энциклопедию Everything2, идеология которой во многом унаследовала черты живых журналов и онлайновых форумов. В этой энциклопедии пользователь может изменять только собственный текст, при этом он не может редактировать тексты, написанные другими людьми. Система полномочий в этой энциклопедии базируется на опыте (eXPerience, коэффициент XP), который приобретают авторы энциклопедии в процессе работы. Опытные пользователи могут оценивать статьи других участников. Сегодня прект насчитывает свыше 70000 зарегистрированных пользователей.

Технология Вики

Википедия базируется на Web-технологии Вики (от гавайского wiki-wiki - "как можно быстрее", автор концепции узнал его в аэропорту Гонолулу, где местное население так называет автобусы). На самом деле технология Вики была роздана задолго до идеи Википедия еще в 1995 году Уордом Каннингемом (Ward Cunningham), и предназначалась для коллективной разработки документации (текстовой и гипертекстовой). Еще Вики расшифровывают как "технологию быстрой правки", однако чаще говорят о ней как о "технологии живых документов".

Первая вики-среда была изобретена Каннингемом для веб-узла Pattern Languages Community с целью упростить совместное создание и ведения программных документов (свободно доступное программное обеспечение Вики на PHP доступно по адресу http://wikipedia.sourceforge.net, а первая его реализация доступна по адресу http://c2.com/cgi/wiki). вики-технология - это основа построения веб-систем, предназначенных для коллективной разработки, хранения, структуризации текста, гипертекста, файлов, в том числе мультимедиа. Все страницы вики-сайта представляют собой статьи, содержимое которых представляет из себя текст, в котором можно использовать простую вики-разметку или тэги HTML.

Проект Вики оказался настолько успешным, что вышел за рамки программного продукта и превратился в концепцию.

Возможность редактировать содержимое вики-сайта любым посетителем, с одной стороны, позволяет без труда накапливать и систематизировать информацию, но, с другой стороны, создаeт обширное поле для внесения ошибок и вандализма. Из-за последнего все вики-сайты используют технологию, обеспечивающую сохранение каждой версии документа. Если документ подвергается вандализму, или в него внесена ошибка при редактировании, пользователь Вики может легко восстановить старую версию, т.е. при необходимости можно быстро вернуться к правильному варианту текста. Программное обеспечение Вики также позволяет ограничить доступ и права редактирования страниц до определeнного круга пользователей.

Назовем лишь некоторые идеи, реализуемые вики-технологией:
-возможность редактирования вики-статей определенным кругом пользователей;
-хранение всех версий вики-статей с момента их создания;
-быстрая и простая генерация гиперссылок между документами, а также поддержка целостности гиперссылок;
-упрощение процесса публикации текста.

Самая известная вики-система - это The Portland Pattern Repository, которая также содержит большую коллекцию ссылок и на другие пакеты программного обеспечения Вики. Можно также отметить, что программное обеспечение Вики во многом сходно с "живыми журналами", при этом оно имеет аналогичные плюсы и минусы. К безусловным плюсам относится простота работы пользователя через обычный браузер. При этом Вики во многих отношениях проще, хотя многие из более многофункциональных и сложных вики-систем позволяют делать резервное копирование, авторизовать пользователей, обеспечивать безопасность контента.

Обычно вики-системы используют доступ к документам через браузер и выдают их в HTML, но, чтобы писать вики-документы, язык HTML знать необязательно. Вики-разметка как правило упрощена до предела: выделенный текст заключают в звездочки, гиперлинки - в квадратные скобки и так далее. Иногда в страницы для редактирования встраивают и специальные скрипты, чтобы документ можно было править привычным способом - нажатием соответствующих иконок. Вместе с тем у Вики есть и особая разметка - прежде всего для организации ссылки на другие вики-тексты.

Корпоративные решения

Технология Вики используется не только в онлайновых энциклопедиях. Так в статье создателя Вики Уорда Каннигема "The Wiki Way" сообщается, что такие крупные компании как Motorola и The New York Times используют Вики во всех рабочих процессах коллективного ведения проектной документации. Первоначально система Каннигема использовалась для создания базы данных для нужд архитектуры и городского планирования, которую энтузиасты пытались расширить на другие области деятельности, включая программирование.

То, что сегодня разрабатывается компанией Microsoft для портала-сервера Sharepoint также можно квалифицировать как вики-технологию. Sharepoint предлагает массу путей обеспечения совместной работы с документами. При этом общее использование файлов далеко уходит от прежнего "разделения документов" (sharing). Происходит переход к совместным библиотекам, откуда документы можно легко достать, поработать с ними и положить на место более удобным, чем раньше, образом.

Википедия

Проект Википедиа, как известно, ориентирован на создание онлайновой энциклопедии, написанной самими пользователями. Каждый посетитель сайта энциклопедии может внести свой посильный вклад: подправить статью, добавить или удалить информацию. Основной принцип Википедии - полнейшая демократия, поэтому начинающий автор может участвовать в проекте наряду с опытными экспертами.

История

Проект Википедия существует с 15 января 2001 года, как публичная универсальная интернет-энциклопедия, в которой автором статьи может выступить любой желающий. Проект является некоммерческим и развивается на средства спонсоров, в основном являющихся простыми участниками Википедии. Координатором проекта является американский фонд Wikimedia Foundation Inc. Создатели Википедии Ларри Сэнгер (Larry Sanger) и Джимми Уэйлз (Jimmy Wales) начали работы по созданию бесплатной библиотеки в 2000 году, которую назвали "Нупедия". По замыслу это была бесплатная коллективно создаваемая энциклопедия, содержание которой могло бы свободно распространяться по лицензии GNU FDL (GNU Free Documentation License). Весной 2000 года был создан сайт NuPedia.com, программное обеспечение которого также было свободным и распространялось в виде открытых кодов (open source) также по лицензии GNU, согласно которой разрешается полномасштабное или частичное использование или тиражирование без каких- либо отчислений.

Однако схема подготовки статей в Нупедию, как показало время, оказалась неудачной, прежде всего, ввиду жесткой модерированности. Предусматривались редакторы, кураторы тем (большинство из которых были известными учеными), которые достаточно жестко селекционировали авторов по квалификации. Отобранные авторы могли начинать писать статьи, которые затем ее редактировали, согласовывались, а лишь затем публиковались на сайте. Это технология обеспечивала высочайшее качество, однако привела к тому, что за два года в 2003 году, просуществовав около двух лет в Нупедии накопилось всего лишь 23 готовых статьи и 68 незаконченных материалов. Очевидно, что этот этап создания общедоступной энциклопедии оказался проваленным и был закрыт. Однако идея оставалась живой, и авторы от нее не отказались.

Вместе с тем, создатели Нумедиа увидели, что главное достоинство вики-систем заключалось не в том, что они не допускают ошибок, а в том, что они позволяют исправлять ошибки очень быстро. Поэтому следующим проектом после Нумедиа, стал проект онлайновой библиотеки с несколько скорректированной идеологией - Википедия. Этот проект изначально взял на вооружение вики-технологию, которая, как показала практика, оказалась идеальной для него. Действительно, если запустить вики-систему, доступную абсолютно всем, и начать создавать на ее базе энциклопедию, которая по мере заполнения будет абсолютно всем видна, можно привлечь к ее написанию всех пользователей Интернета. По замыслу авторов весь мир будет писать туда статьи, дополнять их по мере необходимости, а также исправлять ошибки. Википедиа должна была позволять писать и публиковать статьи абсолютно всем желающим безо всяких редакторов. К тому же править статью сможет тоже сможет любой, а не только автор. Мало того, предусматривалось, что история правок хранится вечно, и если какая-либо статья будет запорчена, всегда можно будет вернуться к старому варианту. Новый сайт проекта получил адрес - Wikipedia.com. Сегодня Википедия - это полноценная онлайновая энциклопедия с 500 тыс. англоязычных статей, 1 млн статей на 186 других языках (прежде всего немецком, японском и французском) и около 50 тыс. авторов и редакторов. Википедия, за короткий срок ставшая одним из популярнейших справочных ресурсов Интернета,

Идеология

Каждый пользователь Интернета может стать автором статьи Википедии. Более того, каждый может поправить чужую статью. В Википедии нет модераторов, поэтому все изменения сразу же становятся видны другим посетителям - стоит только нажать на кнопку "записать страницу" под окном правки. Для этого не надо даже авторизоваться и (хотя рекомендуется).

Казалось бы, Википедия представляет собой хаотическую систему, в которой злоумышленники и вандалы могут играть решающую роль. Такая онлайновая энциклопедия могла бы очень быстро превратиться в среду для конфликтов и оскорблений. Однако ничего подобного не произошло. Но в том то и заключается основной феномен Википедии, что на самом же деле Википедия - самоорганизующаяся система, в которой знания отбираются, кристаллизуются и шлифуются. Статьи в Википедии написаны достаточно грамотно и часто даже превосходят по точности и полноте изложения статьи из традиционных энциклопедий, превосходя последние по оперативности.

Существуют три взаимодополняющих объяснения этому феномену:
- в системе продуманы простые и четкие правила составления и редакции статей;
- в системе предусмотрено "общественное" администрирование со своей иерархией администраторов, которые назначаются исходя из их вклада в развитие системы;
-вандалов, злоумышленников (или, как их называют в Википедии, "троллей") в действительности в десятки раз меньше, чем участников проекта, вносящих позитивный вклад.

Правила написания статей в Википедии действительно простые: статья должна быть нейтральной, и статья не должна быть оригинальным исследованием. Т.е. Википедия - это источник вторичной информации, это не научный журнал. Предполагается, что статьи для Википедии следует писать на литературном языке в научном стиле. Писать разрешается только от третьего лица без просторечных и сленговых выражений, а также без личных подписей и замечаний.

Кроме того, рекомендуется писать статьи беспристрастно и объективно, т.е. без эмоций, которые в объективной и точной энциклопедии являются излишними. Рекомендуется также писать с нейтральной точки зрения: если высказываемое в статье утверждение спорно или не является общепризнанным, это нужно указать, причeм весьма желательно ссылаться на источник спорного утверждения.

Для участников Википедии все же самым важным принципом является "нейтральная точка зрения". В соответствующих рекомендациях указано, что статьи онлайновой энциклопедии должны "представлять идеи и факты таким образом, чтобы сторонники и противники данной точки зрения могли прийти к согласию". "Мы не пропагандируем какую-то точку зрения, неважно, считаем ли мы еe верной или нет, - мы стремимся рассказать обо всех существующих - я считаю, что это одна из важнейших особенностей нашего проекта, которая помогает людям быть свободными, не поддаваться тоталитаризму и пропаганде", - сказал в интервью один из администраторов Википедии Максим Вотяков (MaxiMaxiMax).

Конечно, предусмотрены некоторые меры по недопущению профанации проекта. Концепцией проекта предусмотрено формирование определенной иерархии общественных администраторов, следящих за соблюдением определенных правил, заключающихся в нейтралитете оценок, соблюдении "энциклопедичности", умении находить консенсус. Ряды администраторов проекта расширяются практически автоматически за счет добавления редакторов-наблюдателей из числа самых активных зарегистрированных авторов. Высший орган Википедии - Wikimedia Foundation, бесприбыльная организация, созданная для эксплуатации проекта. Напомним, что все содержание Википедии находится под действием лицензии GNU Free Documentation License. Таким образом, любые тексты из Википедии могут свободно копироваться и распространяться при условии, что и Принцип "наследования" прав называется "копилефт" (калька с английского "copyleft", противоположность "copyright").

Тексты для Википедии должны создаваться или заимствоваться из лицензионно чистых источников, например, из документов, распространяющихся по той же GNU FDL, или документов, составляющих "общественное достояние" (public domain). К таким документам относятся, в частности, издания, у которых закончился охранный срок авторских прав. Приветствуются и переводы недостающих статей из национальных версий Википедий. При этом совершенно справедливо декларируется то, что Википедия не может никаким способом гарантировать правильность приведeнных в ней данных. Во время прочтения они могли быть изменены, испорчены, либо написаны тем, чьe мнение отличается от общепринятого в соответствующей области знаний. Поэтому в лицензии зафиксировано: "Википедия не может нести ответственность за любой нанесeнный ущерб, так как является добровольным сообществом, свободно организованным для создания открытых образовательных, культурных и информационных ресурсов. Информация предоставляется как акт доброй воли и не существует соглашения или акта о намерениях между вами и Википедией относительно использования или изменения информации, не предусмотренного GNU Free Documentation License. Также никто в Википедии не несет ответственности за изменение, редактирование или удаление любой информации, добавленной вами в Википедию или другие связанные с ней проекты".

И наконец, в Википедии исправлять все гораздо проще, чем портить, так как вики-среда хранит историю всех изменений всех страниц сайта. Любой пользователь, увидев вандализм, может кликнуть на ссылку "История" и восстановить любую предыдущую версию страницы. Все изменения в статьях отслеживаются добровольцами, и никому еще не удавалось надолго испортить статьи или злонамеренно внести туда недостоверную информацию. Соответствующий эксперимент был проведен журналистами New York Times, которые специально испортили несколько статей. Менее чем за пять минут все изменения были исправлены. И еще одно соображение: вряд ли кто-то станет писать энциклопедические статьи, не зная предмета.

Тех же пользователей, которые слишком часто нарушают правила, может заблокировать администратор.

В месте с тем, использование Википедии, особенно на начальном этапе развития проекта вызывало определенные опасения у специалистов: все же Википедия не имеет научной редакции, различные статьи Википедии неравноценны, большее внимание в уделяется актуальным событиям, чем устоявшейся информации. Принцип создания этой энциклопедии порождает и, пожалуй, главную проблему: тексты Википедии по сути, отражают мнения большинства пользователей энциклопедии. При этом могут быть пропущены альтернативные, порой более правильные взгляды. Т.е. контент Википедии соответствует представлениям "среднестатистичекого" читателя. Но это и есть отличие энциклопедии от научного исследования.

Однако, несмотря на все опасения и недостатки, Википедия, особенно ее англоязычная версия, является сегодня, похоже, наиболее точным и полным сетевым ресурсом информационно-справочного характера.

Часть 2. Технологии

Страницы Вики-сайта представляют собой статьи, содержимое которых - это обычный текст, в котором можно использовать теги HTML или особую вики-разметку, более удобную для текстовых документов, чем HTML. Воспользовавшись ссылкой или кнопкой, любой посетитель вики-сайта может отредактировать и сохранить измененный вариант текста любой существующей страницы или создать новую. Процедура публикации текста в Википедии сведена к двум кнопкам - редактировать и сохранить.

Определенная часть статей в Википедии представляет собой созданные автоматически "заготовки". Когда любой автор отмечает в тексте термин или выражение как ссылку на несуществующую статью, в Википедии автоматически генерируется новая статья-шаблон, содержащая текст: "статья еще не написана, можете ее написать". Авторы, заходящие по этой ссылке, расширяют содержание "пустышки". Для публикации, например, математических формул в Википедии используется разметка TeX -языка программирования специального назначения, который широко применяется при подготовке текстов научно-технического характера, создателем которого был Д. Кнут.

Для того, чтобы на этом языке представить формулу суммы от нуля до бесконечности х в степени n деленную на n факториал, в статье достаточно записать код:

<math>\sum_{n=0}^\infty \frac{x^n}{n!}</math>

В зависимости от желания автора и сложности формул, записываемых в текстах статей, генерируются либо изображения формул в формате PNG, либо простой код HTML. Предполагается, что с ростом функциональности браузеров будет генерироваться расширенный код HTML или MathML.

История правок всех вики-статей хранится в базе данных (кнопка История на интерфейсе редактирования статьи), любая редакция статьи может быть вызвана на экран и сохранена, как последняя.

Почти любую страницу этого сайта можно отредактировать. Для того чтобы внести правки в статью:
- щелкните по кнопке править или по ссылке править (для раздела статьи), после чего откроется форма с текстом статьи (раздела);
- внесите желаемые правки в текст статьи;
- с целью контроля просмотреть перечень внесенных правок (клавиша ' Внесенные правки');
- убедиться в корректности правок просмотрев предварительно текст статьи (клавиша ' Предварительный просмотр');
- Заполните поле ' Кратко опишите суть вашей правки ';
- нажмите кнопку ' Записать страницу '.

В тексте статьи для улучшения читабельности и создания гиперссылок (вики-ссылок) можно использовать вики-разметку, отличающуюся простотой и прозрачностью.

В Википедии имеется быстрая и понятная даже новичкам автоматизированная генерация и поддержание целостности гиперссылок между документами на всем сайте. Проблемы с неразрешенными ссылками в Википедии просто не существует. Для того, чтобы создать гиперссылку на статью, не нужно запоминать сложный синтаксис, как в HTML (<a href=http://адрес ссылки>Название ссылки</a> и т. д.), достаточно просто при внесении вики-разметки заключить название статьи, на которую требуется сослаться, в двойные квадратные скобки - [[Название статьи]].

Если статьи, на которую указывает ссылка, не существует, то ссылка все таки создастся, но текст красного цвета, а не обычного синего. Активизировав эту ссылку можно перейти к шаблону статьи и написать ее, фактически откорректировав шаблон. Таким образом, в Википедии существует три вида ссылок - на существующие статьи, на статьи еще ненаписанные и на внешние Web-ресурсы, например, после внесения разметки [http://chip.ua/ "CHIP"], можно увидеть в окне браузера голубую ссылку CHIP.

В вики-среде, естественно, можно использовать и таблицы, их форматирование также упрощено, по сравнению с HTML, однако, любители последнего могут воспользоваться интерактивным конвертором HTML-таблиц в синтаксис системы Вики, обращение к которому возможно по адресу: http://www.wackyboy.com/ConvertHtmlTableToWikiTable.html.

Статьи Википедии, как уже говорилось, может исправлять и дополнять кто угодно - и, судя по числу правок, зарегистрированные википедисты составляют от силы 50% от всех авторов текстов.

Для обсуждения отдельных текстов можно воспользоваться кнопкой Обсуждение сразу после текста статьи.

Физически Википедия размещается на 25 серверах, расположенных в США. Серверы работают под управлением Linux (RedHat 9 и Fedora Core). На двух хранится база данных (MySQL), три используются для кэширования запросов (Squid), пятнадцать работают как веб-серверы (Apache). Остальные являются почтовыми и/или DNS-серверами. За время существования проекта программное обеспечение Вики менялось трижды. Сейчас используется открытое программное обеспечение Mediawiki 1.3.1, написанное на PHP 4, которое было разработано специально для Википедии некоммерческой организацией WikiMedia. На этом же программном обеспечении работают и другие проекты Википедии, такие как Вики-учебник, Вики-словарь, Вики-новости и т.д. У Википедии много общего, как в идеологии, так и в технологической части с "живыми журналами" (LiveJournal). Одна из общих черт технологии Вики и живых журналов - это то, что документы в них хранятся в базе данных, и ни одна из версий не уничтожается. Даже при минимальном изменении в документе создается новая версия.

Текущей версией считается всегда последняя, однако всегда возможен откат на любое число шагов назад.

В настоящее время для проектов Википедии используется система распределения серверной нагрузки Perlbal и система оптимизации работы с данными memcached, которые, как и LiveJournal разработаны компанией Danga. Википедисты активно используют для общения не только многофункциональный вики-интерфейс, но и, собственно, живой журнал, где, например, у русских участников проекта есть свое сообщество ru_wikipedia. Вандализм

Вандализм в Википедии - это явно вредительское добавление, удаление или изменение содержания, в целях скомпрометировать достоверность и авторитетность энциклопедии (или воспользоваться ей для других злонамеренных действий). Вандализм во многом свойственен человеческой натуре, поэтому всегда необходимо быть начеку и адекватно ему противодействовать.

При этом грань между ошибочными и злонамеренными действиями всегда тонка, например, внесение неверных правок по причине заблуждения вандализмом не считается. В любой момент любой пользователь может запросить разницу между любыми двумя прошлыми версиями статей Википедии, что позволяет легко и быстро замечать случаи злонамеренных действий - вандализма. Практика показывает, что последствия вандализма оперативно ликвидируются администраторами, а также обычными пользователями. В случае выявления вандалов, администраторы имеют также права отключения возможности редактирования для отдельно взятых ip-адресов. Не только администратор, но и любой участник проекта, даже анонимный, заметивший явный вандализм, всегда может собственноручно сделать откат, вызвав старую версию статьи, перейдя к ней по ссылке редактирования и сразу же сохранив ее, поэтому в целом Википедии на постоянно находятся в адекватном состоянии.

В рамках проекта Википедия принята такая классификация вандализма:
- спам - добавление неприемлемых внешних ссылок с рекламными целями;
- бот-вандализм - изменение большого числа страниц с помощью специальной программы-бота;
- детский вандализм - добавление графитти или очистка страниц;
- глупый вандализм - добавление шуточных статей или изменение существующих статей "шутками";
- подлый вандализм - труднообнаруживаемый вандализм. Добавление ложной информации;
- вандализм, привлекающий внимание - добавление оскорблений, непристойностей и т.д.;
- вандализм пользовательских страниц - злонамеренное искажение содержимого пользовательских страниц ;
- вандализм изображений - загрузка непристойных изображений.

В Википедии классифицируются не только вандалы, но лица, не соблюдающие сетевой этикет, их называют "троллями". Тролли не вандалы занимаются следующим:
- помещают материалы, защищенные авторским правом;
- не придерживаются нейтральной точки зрения;
- помещают в статьи явную рекламу;
- оскорбляют других участников Википедии;
- пишут бессмысленные статьи;
- помещают в статьи изображения непристойного характера.

Редакторы сайта Slashdot.org дополнили эту классификацию, конкретизируя:
- тролли-вредители - пытаются внести такую разметку, тексты, картинки, чтобы испортить адекватное отображение интерфейса Википедии в браузере, например,

путем вставки специальных тегов, крупных картинок или Java-скриптов;
- тролли-хамы - грубо оскорбляют всех и каждого, вступают со всеми в перебранку;
- маскирующиеся тролли - формируют ссылки на сайты, которые хотят раскрутить;
- тролли-уникумы - первыми пишут комментарии к тексту с бессмысленным содержанием, разжигать бессмысленные споры.

Вики-войны

Если справиться с вандалами "адекватным пользователям" Википедии вполне по силам, то внутренние расколы действительно порой приводят к не всегда предсказуемым последствиям. В Википедии периодически возникают так называемые "Вики-войны", когда друг с другом спорят сторонники разных точек зрения на тот или иной вопрос. Одна и та же статья может корректироваться десятки раз в день, и администраторы в меру своих сил пытаются разрешать подобные конфликты.

Многие тематические статьи о последних событиях подвергаются тенденциозной правке различными сторонами. Статьи по темам, где мнения общественности расходятся наиболее резко, становятся полем виртуальных боев конфликтующих авторов. Наиболее конфликтные темы последнего года - это "Буш и Кэрри", "Сексуальный сленг", "Иисус", "Евреи". Википедия в этих случаях используется как раскрученная площадка для наглядной агитации. Администраторы, как правило, стараются убедить все стороны в том, что Википедия по определению должна быть беспристрастной, а споры должны вестись в рамках специальных вики-форумов.

Сообщество Википедии

Количество авторов Википедии постоянно растет. Состовляя особую социальную среду, википедисты знают друг друга, в основном, по "никнеймам" (nickname). С другой стороны, википедисты пишут о том, что хорошо знают сами, серьезно относятся к своему занятию и умеют отвечать за свои действия. По сути, со стороны сообщество (community) википедистов выглядит как аналог "Живого журнала", с той лишь разницей, что википедисты собрались не просто для дискуссий, а для выполнения общей задачи создания энциклопедии. Конечно же вики-технология дает сообществу весь необходимый для интерактивного общения инструментарий.

Сообщество википедистов поддерживают свои собственные информационные ресурсы (не только Википедию), на главных страницах портала Википедии всегда можно найти каталоги- путеводители, интересные факты, новости, статьи. И все это делается на программном обеспечении Вики.

Наряду с демократией, царящей в этом сообществе, в Википедии существует многоуровневая иерархическая система - от анонимных пользователей до "Царя-и-Бога". Администраторы первого уровня - системные операторы или "сисопы", следят за порядком и "нейтрализуют" злоумышленников. Администраторы второго уровня - "бюрократы" - курируют проекты, третьего уровня - "стюарды" - наблюдают за предметными областями. Отдельным эшелоном идут программисты-разработчики, развивая Вики-систему. Царь-и-Бог (GodKing) Википедии - это Джимбо (основатель проекта Джимми Уэйлз), который имеет все возможные права и способен решить любые проблемы, возникающие в Википедии. Однако, на самом деле Джимбо редко вмешивается в управление Википедией.

Количество авторов Википедии сегодня приближается к 20000. Распределение количества статей, написанных разными авторами, вполне соответствует правилу Парето - 80% статей пишут 20% авторов. Кроме того, среди авторов явно выделяются те, на счету у которых десятки тысяч статей. Это участники сообщества, которые просто фанатично преданы Википедии. Иногда статьи пишут не сами люди, а роботы, которыми они управляют. Безоговорочным лидером по количеству публикаций являются два робота - программы Rambot и D6. Среди людей явный лидер - это Дерек Рамси (Ram-Man), на счету которого уже более 440000 публикаций - в среднем - пять статей в день. Именно на языке Java Дерек Рамси создал робота Rambot, которая автоматически составляет и публикует тексты по американским населенным пунктам (на счету у программы более 131 тысяч записей). В число лидеров входит и математик Чарльз Мэттьюз, который сам пишет немного новых текстов, но постоянно следит за более чем тремя тысячами статьями на математические темы и редактирует их. Опыт сообщества Википедии говорит о том, что людей знающих что-либо на хорошем профессиональном уровне достаточно много, и среди них немало "неизвестных героев", которые готовы поделиться бесплатно своими знаниями с остальными. Современное состояние

Благодаря успеху Википедия у проекта появились новые ответвления. Сейчас на сайте Wikimedia Foundation размещаются проекты Вики-словарей, Вики-цитатник, Вики-учебники, Вики-программные коды и ряд других. В конце 2004 года было запущено агентство новостей Wikinews (Вики-новости).

Википедия, являясь феноменом, сама по себе, породила ряд производных феноменов. Например, парадоксальные результаты были получены в результате сравнения Википедии, проекта Everything и традиционной энциклопедии. Несмотря на ничем не ограниченную свободу авторов, статьи Википедии в своем большинстве являются стилистически однородными, представлены в едином формате и раскрывают, как правило, одно, основное значение слова. Авторы же Everything2, наоборот, злоупотребляют сленгом. Эти статьи, кроме того, неоднородны по своей структуре. К удивлению ученых, несмотря на самые либеральные правила, с точки зрения синтаксиса и семантики языка Википедия практически не отличается от традиционной энциклопедии. Лингвисты полагают, что определяющую роль в этом сыграли два основных фактора - во-первых, правилами, определенными для авторов (формальное описание, нейтральность и последовательность), и, во-вторых, деятельность преданных участников сообщества. Доброжелательных пользователей в десятки и сотни раз больше, чем недобросовестных и вандалов. Поэтому большая часть некачественного контента удаляется еще до того, как ее успевают увидеть пользователи Интернет.

Национальные Википедии

На сегодняшний день англоязычная Википедия самая большая в мире - свыше 450 тысяч статей и 90 тысяч иллюстраций (для сравнения: в "Британнике" - около 120 тысяч статей, а в последнем издании БСЭ - 100 тысяч). На сайт английской версии Википедии (en.wikipedia.org) ежедневно заходит больше 300 тысяч человек, а на все сайты wikipedia.org - 750 тысяч. Вторая по величине Википедия - немецкая, она содержит более 188 тысяч статей. Третья по величине Википедия - японская, у нее сейчас 94 тысячи статей. Символический порог в 50 тысяч статей преодолели еще три Википедии - французская, шведская и польская. Около 20 языковых версий уже преодолели порог в 10 тысяч статей, среди них версии на болгарском, испанском, каталонском, китайском, польском, финском, русском, украинском, эсперанто. Всего разных языковых версий около ста. По адресам uk.wikipedia.org и ru.wikipedia.org находятся украино- и русскоязычные части Википедии. Еще один русскоязычный проект - ВикиЗнание находится по адресу www.wikiznanie.ru.

Самое большое количество статей в Википедии представлено на английском языке. За пределами первой пятерки языков лидерами по числу статей являются голландский, польский, испанский, итальянский, португальский и датский. Затем следуют идет китайский (интересно, что Википедию в Китае запретили летом 2004 года, но через две недели запрет сняли). Украинская и русская части Википедии в настоящее время охватывают приблизительно по 20 тысяч статей, и темпы их роста одни из самых высоких (по 1000 статей в месяц). Очевидно, что не все украино- и русскоязычные пользователи Интернет знают о Википедии, имеющиеся читатели еще не привыкли сами писать статьи, но если учесть, как среди этих пользователей много ученых и студентов, можно ожидать значительный рост темпа заполнения этих ресурсов. Находятся и спонсоры. Так роль информационного спонсора русской Википедии взяло на себя Российское издательство "Бестселлер", которое, кроме того, взяло на себя и намерено заниматься популяризацией проекта.

Википедия и семантика

Основная идея Семантического веб - построение сети знаний, чтобы пользователь, обращаясь в Интернет с запросом, получал не ссылки на объект поиска, а его описание, параметры, основные сведения, т.е. знания. Достигается это путем отказа от оформительских, дизайнерских возможностей, перехода от HTML к XML, использования семантической разметки, построения, так называемых, онтологий. При этом представление информации на сайтах становятся более ориентированными на компьютеры, чем на людей. В соответствии с концепцией Семантического веб, сайты, входящие в него должны специально адаптироваться, - они должны переформатироваться, должна быть добавлена семантическая разметка.

В этом плане Википедия представляет собой альтернативный подход для достижения той же цели - получения знаний. Поиск в Википедии даже по обычным ключевым словам приводит к получению содержательных материалов, содержащих сконцентрированные знания.

Многие современные поисковые системы в Интернет учли преимущества Википедии. Сегодня результаты из Википедии выдаются первыми в поисковых системах Yahoo!, Google, Answers.com. В частности, на сайте Answers.com одним щелчком мыши можно получить информацию на любую тему, не ссылки на другие веб-страницы, а именно чистую информацию. Это вызвало удивление-восторг у пользователей и прессы, ведь практически происходит поиск в гигантской электронной энциклопедии, объемом свыше 1 млн словарных статей. Всю информацию сайт Answers.com получает в реальном режиме времени из различных источников, в том числе из различных специализированных энциклопедий (в этот список входит и Википедия), словарей, атласов и т.д. Всего в список входит около 100 тщательно отобранных редакторами авторитетных информационных источников (вместо сотен миллионов сайтов, индексируемых, например, поисковой системой Google). Запатентованная технология "1-Click Answers" (получение ответов одним щелчком мыши) представляет собой подход к получению информации, напоминающий проект британских ученых Liquid Information (жидкая информация), который обещает изменить всю концепцию современного веба. В соответствии с этой концепцией каждое слово на странице браузера превращается в гиперссылку, что и называют это сетью нового поколения. Проект Liquid Information, фактически, развивает идеи WWW, добавляя вебу интерактивности.

Перспективы

Сегодня Wikimedia Foundation создает все новые проекты, развивая не только основные направления Википедии. Среди таких проектов, создаваемых в рамках идеологии Вики, можно назвать, например, Вики-словарь (толковый словарь), Вики-учебник (коллективно написанные учебники), Вики-цитатник (сборник цитат).

За время своего развития проект Википедии, несмотря на опасения, связанные с непрофессиональностью авторов, возможным вандализмом, спонтанностью создания отдельных статей, позволил создать достаточно качественный продукт - полную и объективную, свободно доступную всем многоязычную энциклопедию.

Успех Википедии продемонстрировал, что пользователи Интернет нуждаются в достоверной энциклопедической информации. Поэтому проект сетевой энциклопедии уже сегодня является серьезным источником справочной информации, знаний, обладающий, в отличие от традиционных источников, замечательной особенностью - оперативностью.

Благодаря росту популярности проекта, на него стали обращать внимание ведущие поисковые системы и интеграторы контента. Так недавно компания Google сделала предложение переместить часть контента энциклопедии на свой хостинг. К слову, на сайте Google тоже использовалась онлайновая энциклопедия, чтобы выдавать ответы на вопросы, заданные на естественном языке. Вместе с тем, для нормальной работы Википедии необходимы уже немалые технические мощности, развитие которых предусматривается уже имеющимся соглашением с компанией Yahoo! Недавно руководство Wikimedia Foundation обнародовали совместное заявление о партнерстве и с этой компанией, которая отдаст Википедии верхние места в результатах своей поисковой системы Yahoo Search.


 Статьи автора, обобщенные в книге 

Поле боя - семантика
Сегодня информационные ресурсы Сети составляют свыше десятка миллиардов документов (Web-страниц), к которым возможен свободный доступ любого пользователя. Естественно, для того, чтобы найти необходимую информацию и этой крупнейшей распределенной полнотекстовой базе данных необходимо использовать самые мощные ИПС. Такие системы существуют и конкурируют друг с другом на современном рынке информационных технологий.
Подробнее >>

Text Mining
Попытки анализа больших объемов неструктурированных или слабо структурированных данных очень часто усложняют процесс принятия решений. Если широкий спектр поисковых систем достаточно легко справляется с "простым" полнотекстовым поиском, то для подобного анализа нужны технологии совсем другого типа, представленные системами добычи знаний.
Подробнее >>

Новостной Интернет
Для решения задачи синдикации новостей было создано несколько форматов описания данных на основе XML. Самый распространенный формат получил название RSS, что означает Really Simple Syndication, Rich Site Summary, хотя изначально он назывался RDF Site Summary. Смысл всех этих аббревиатур заключается в простом способе обобщения и распределения информационного наполнения Web-сайтов - синдикации контента.
Подробнее >>

Система InfoStream®

При непосредственном участии автора и под его научным руководством в ElVisti создана система InfoStream®, с помощью которой охватываются новости из тысяч Web-сайтов, осуществляется их обработка и обобщение. Сервисы, построенные на основе Infostream, обеспечивают пользователям одновременный доступа в режиме поиска к информации из многих Web-сайтов, предоставляют возможность смысловой обработки и, вследствие этого, минимизацию усилий на получение необходимых данных из Интернет.

Методическое пособие


P e к л а м a: