UseNet ресурсы в сети Internet

Ландэ Д.В.

Одним из источников информации, доступных в сети Internet являются телеконференции Usenet. Телеконференциями (группами новостей) в свое время были названы файловые области на серверах, к которым имели доступ на чтение и запись все желающие обмениваться информацией по определенным темам. Все это очень похоже на концепцию электронных досок объявлений (BBS). Различие заключается в следующем - общедоступные телеконференции Usenet физически размещаются на большом числе узлов сети, каждый абонент любого из которых может вносить в телеконфернцию свою информацию, будучи уверенным, что его информация автоматически распространиться по всем остальным узлам. Это обеспечивается использованием унифицированных сетевых протоколов и программного обеспечения. Поток данных Usenet переносится по сети Internet и другим сетям. В качестве стандарта обмена сообщениями Usenet в Internet используется специальный протокол NNTP (Network News Transfer Protocol - протокол передачи сетевых новостей). Usenet появилась на базе сетевого протокола UUCP (Unix-to-Unix Copy Protocol). Считается, что Usenet расшифровывается как "User's Network", хотя создатели Usenet в 1979 году образовали название из "USENIX Network" (USENIX - ассоциация пользователей UNIX).

В настоящее время в сети Usenet активно функционирует свыше 15.000 телеконференций, которые отражают практически все стороны жизни. В телеконференциях можно встретить документацию по самому современному программному обеспечению, статьи известных ученых, демонстрационные версии программ, статьи и дискуссии на политические темы, советы по воспитанию детей и т.д. Имена телеконференций имеют иерархическую структуру. Высшие уровни этой структуры называется иерархиями. Иерархии бывают территориальными, - тогда их названия совпадают с обозначениями стран или доминирующих в этих странах систем, например, de, ukr, relcom. Существуют также экстерриториальные иерархии, самые известные из которых следующие:

- comp - телеконферции для обсуждения вопросов, связанных с компьютерами и программированием;

- news - обсуждение программы обмена новостями, вопросы развития системы телетелеконферций;

- rec - отдых, хобби, увлечения;

- sci - телеконферции для дискуссий и обмена опытом по различным научным дисциплинам;

- soc - вопросы общественной жизни;

- talk - телеконферции, ориентированные для обсуждения спорных вопросов, для любителей просто поговорить на какую-нибудь тему;

- misc - темы, не входящие ни в один из остальных классов или относящиеся сразу к нескольким;

- biz - бизнес;

- alt - альтернативная иерархия. Альтернативность заключается в упрощенном алгоритме заведения новых телеконферций в этой иерархии, а также, в содержании отдельных статей и групп.

Название телеконференции представляет собой конкатенацию названия иерархии и темы, связанных точкой как разделителем. Например, телеконференция news.answers относится к иерархии news и посвящена ответам на часто задаваемые вопросы. В данном случае телеконференция имеет двухуровневое название. Однако если двухуровневые названия оказываются достаточно широкими для освещения класса проблем, то формируются трех-, четырех- или пятиуровневые названия. Например biz.marketplace.services.non-computers. Таким образом, система имен телеконференций представляет собой адаптивный политематический иерархический рубрикатор, позволяющий ориентироваться в море сетевой информации.

Традиционно в телеконференции Usenet запрещалось помещать любую коммерческую информацию, однако эта традиция была "сломлена", в результате чего сегодня определенную нишу в системе телеконференций занимает коммерческая информация. В коммерческих телеконференциях абоненты размещают рекламные объявления о покупке, обмене или продаже товаров или услуг. Пользователям сети Internet в настоящее время доступны, например, такие коммерческие телеконференции украинской части Usenet:

ukr.commerce.auto         - автомобили, автозапчасти, автоуслуги, и дру-
                            гое (кроме топлива - для топлива  предназна-
                            чена ukr.commerce.energy)
ukr.commerce.orgtech      - для оргтехники, аудио- и видеотехники, комп-
                            ьютеров;
ukr.commerce.food         - для продуктов питания и напитков;
ukr.commerce.household    - для товаров народного потребления (холодиль-
                            ники,   кофемолки,  пылесоси, мебель, ковры,
                            etc.)
ukr.commerce.construction - строительство, стройматериалы, строительные
                            инструменты и оборудование etc.
ukr.commerce.estate       - недвижимость (дома, квартиры, земля etc.)
ukr.commerce.machinery    - для оборудования, станков, техн. линий etc.
ukr.commerce.metals       - для металлов, металоизделий;
ukr.commerce.energy       - для топлива, смазочных материалов;
ukr.commerce.chemical     - для химических материалов,препаратов,удоб-
                            рений etc.
ukr.commerce.infoserv     - для для публикации новостей, связанных  
                            с информационным бизнесом в Украине и мире;
ukr.commerce.price-lists  - для публикации прайс-листов различных  ор-
                            ганизаций.
ukr.commerce.money        - для коммерческих обьявлений по конвертации,
                            валюте, кредитам, ценным бумагам, etc.
ukr.commerce.misc         - для коммерческих обьявлений, не подходящих
                            ни для одной из перечисленных выше рубрик

Украинские некоммерческие телеконференции доступны сегодня в таком составе:

- ukr.netnews - предназначена для публикации новостей, связанных с работой украинской сети, обсуждением ее общей политики, направлений развития информационных услуг в рамках сети, развития и географического распространения самой сети, разработки, реализации и эксплуатации новых программных и технических сетевых средств, а также для публикации информации и обьявлений о развитии и функционировании других сетей на Украине;

- ukr.politics - предназначена для высказываний и дискуссий на политические темы, представляющие интерес для граждан Украины;

- ukr.law - предназначена для публикаций и дискуссий, непосредственно связанных с Украинским законодательством и вопросами законодательства вообще;

- ukr.science - предназначена для общения ученых. В ней уместны сообщения о планируемых конгрессах и семинарах, сообщения о базах данных с научной информацией, о новостях научного мира;

- ukr.finance - предназначена для публикации информации, связанной с текущими курсами различных валют, акций, сертификатов и других ценных бумаг на рынке, а также, законодательных актов и прочих документов о финансах;

- ukr.comp.software - для бесед на темы, сязанные с техникой программирования. Здесь неуместна реклама программных продуктов;

- ukr.comp.hardware - для бесед на темы, связанные с вопросами аппаратной части электронно-вычислительной техники;

- ukr.comp.binaries - для публикации двоичных текстов компьютерных программ;

- ukr.soft-house предназначена для обсуждения целей, форм и путей обьединения украинских программистов;

- ukr.archives - информация о новых поступлениях на файловых серверах Украниы;

- ukr.nodes предназначена для обсуждения Почтмейстерами Украинских узлов Internet , а также всеми другими лицами, чья деятельность связана с поддержанием функционированния Украинской телекоммуникационной сети, технических вопросов, вопросов политики межуэловых связей;

- ukr.maps предназаначена исключительно для сообщений о регистрации, ликвидации или измемения маршрутизации адресов абонентов украинских узлов InterNet.

Телеконференции могут быть модерируемыми (или управляемыми) или немодерируемыми. Модерируемые телеконференции могут наполняться информацией только определенными лицами - модераторами. Остальные пользователи сети могут только читать эту информацию. При этом модераторы несут ответственность за содержание телеконференций. Немодерируемые телеконференции свободны для внесения информации любого пользователя сети. Модерируемые конференции, становятся средством выражения мнения модераторов - т. е. направленным средством массовой информации - электронными газетами. Пример одной из самых серьезных коммерческих электронных газет доступных в сети Internet в виде телеконференций по технологии Usenet - это иерархия телеконференций Clarinet, включающая свыше сотни групп новостей, посвященных политической, экономической, правовой, спортивной и т.п. тематикам, при этом наполнением телеконференций занимается несколько информационных агентств, среди которых, например, Reuter, API, UPI, NewsBytes. В украинской части Internet узле в Информационном Центре "ЭЛВИСТИ" создана иерархия модерируемых конференций elvisti.info.*, включающая свыше 40 групп в основном посвященных научно-технической и экономической проблематике. Дистрибьюторами этой иерархии сегодня выступают около 30 узлов Internet в Украине.

Таким образом, система телеконференций Usenet может расматриваться как достаточно большое информационное хранилище - месячный архив постоянно обновляемой сетевой информации составляет сотни гигабайт. Естественно возникает вопрос - как обеспечить эффективный доступ к информации такого рода? Есть два основных подхода к решению этой проблемы.

Первый подход заключается в использовании на рабочих местах абонентов программ, обеспечивающих удобный интерфейс при работе с иерархиями телеконференций (так называемых, программ-агентов новостей). Сегодня в качестве программ-агентов могут использоваться практически все современные Web-броузеры, например Microsoft Explorer, Netscape Navigator. Хорошее впечатление оставляет агент системы новостей, встроенный в "легковесный" Web-броузер Opera, с которым можно ознакомиться в Internet по адресу http://www.operasoftware.com.

+------------------+
|                  |
|                  |
|                  |
|                  |
+------------------+

Рис. 1. Интерфейс просмотра новостей в броузере Opera

Второй подход, сотоит в использовании возможностей поисковых серверов сети Internet. Несмотря на то, что технология Usenet, появившись значительно раньше Web-технологии, имеет собственные механизмы и средства доступа к информации, сегодня можно констатировать, что Web-механизмы (engine) представляют собой самый удобный и эффективный способ доступа к ресурсам Usenet. В настоящее времяя существуют тысячи серверов, обеспечивающих шлюзы между этими двумя технологиями. Эти серверы кроме того обеспечивают посиковые возможности, которых так не хватало системе Usenet на этапе ее становления.

AltaVista

Известный поисковый сервер AltaVista находится в сети по адресу http://www.altavista.digital.com. Вариант сервера, который поддерживает многоязычный интерфейс (в том числе и русскоязычный) находится по адресу http://www.altavista.telia.com. Сервер обеспечивает поиск по всем видам ресурсов сети Internet, в том числе и по телеконференциям Usenet. Для того, чтобы задать этот тип поиска необходимо выбрать именно этот ресурс при эадании критерия поиска. Возможен поиск по терминам, входящим в тексты сообщений, авторам, адресам электронной почты, названиям телеконференций. В режиме расширенного поиска допускается использование логических и контекстных операций. Следует отметить, что качество индексирования и ретроспектива хранения сообщений из телеконференций, в отличие от качественных показателей индексирования других ресурсов сети, не очень высоки. Так например, по запросу всех сообщений из телеконференции ukr.nodes система выдает около 20 сообщений, в то время как недельная ретроспектива этой телеконференции содержит свыше сотни статей. Значительно лучшие результаты показывает универсальный поисковый механизм для работы с Usenet - сервер Deja News. А по проблеме украинских телеконференций наиболее полное решение дает специализированный сервер украинских ресурсов сети Internet - El.Visti.Net.

+------------------+
|                  |
|                  |
|                  |
|                  |
+------------------+

Рис. 2. Сервер Altavista в режиме работы с новостями Usenet

Deja News

Поисковая машина Deja News находится в сети по адресу http://www.dejanews.com. Этот сервер позволяет проводить непосредственный поиск по словам или словосочетаниям с использованием логических операций (Or, And, Not) и оператора контекстной близости (Near). В отличие от AltaVista сервер обеспечивает текже иерархический просмотр самых популярных иерархий телеконференций в виде каталога, работу с собственными тематическими категориями Deja News. Поиск может быть ограничен функцией фильтрации (Filter Search), благодаря которой можно сузить поиск указанием определенной телеконференциии, автора, заголовка или даты. Сервер Deja News позволяет не только просматривать сообщения телеконференций, но и отвечать на определенные статьи непосредственно в телеконференции, поддерживая общедоступные дискуссии, а также отправлять собственные сообщения. Этот сервер, обладая всеми преимуществами универсального инструмента, однако в некоторых аспектах уступает специализированным серверам. Так, например, объем 90-дневной ретроспективы украинских телеконференций на этом сервере составляет от 3 до 5 тысяч записей, в то время, как количество уникальных сообщений с 30-дневной ретроспективной на специализированном сервере поиска в украинских ресурсах сети Internet составляет от 15 до 20 тысяч записей.

+------------------+
|                  |
|                  |
|                  |
|                  |
+------------------+

Рис.3. Интерфейс сервера Deja News

El.Visti.Net

Сервер поиска в украинских ресурсах сети Internet расположен по адресу http://el.visti.net. Наряду с возможностями поска по Web-страницам и серверам, а также по реферативным описаниям Web-серверов, один из разделов сервера посвящен поиску в украинских телеконференциях Usenet. Сервер обеспечивает поиск по автору, названию телеконференции, терминам из текстов и заголовков статей, а также работу с использованием логических операций (Or, And, Not). База данных на сервере пересоздается четыре раза в сутки. При отображении найденной информации выводятся такие поля, как заголовок, дата, имя телеконференции, название организации, адрес отправителя и тело сообщения (текст).

+------------------+
|                  |
|                  |
|                  |
|                  |
+------------------+

Рис.4. Поиск в украинском Usenet. 

Olan.Com

На работу с коммерческой информацией из телеконференций русско- и украинскоязычной части Usenet ориентировано несколько серверов, среди которых выделяется сервер, находящийся по адресу http://www.olan.com/koi8/engine, имеющий название "Маркетинговый механизм Internet" (IME). На этом сервере заиндексирован весь объем телеконференций иерархий relcom.commerce.* и ukr.commerce.*. При этом создан тематический каталог, поддерживаемый достаточно мощным рубрикатором.

+------------------+
|                  |
|                  |
|                  |
|                  |
+------------------+

Рис.5. Классификатор IME

Открытые серверы

Для того, чтобы обеспечить доступ к телеконференциям из общепринятых программ агентов новостей, им в определенных настройках необходимо указать имя сервера новостей, с помощью которого обеспечивается непосредственный доступ к материалам телеконференций. Протокол, как набор правил и команд, в соответствие с которым в сети Internet обеспчеивается доступ и распространение телеконференций Usenet, называется NNTP (Network News Transport Protocol). В соответствие с этим, и серверы, обычно обозначаются как nntp-серверы или серверы новостей. При работе с обычной электронной почтой в режиме off-line используются стандартные шлюзы между системой новостей и электронной почтой также серверами новостей. Как правило, эти серверы имеют свой адрес электронной почты, по которым им пишутся письма-запросы. Поэтому следует различать nntp-серверы и почтовые серверы новостей. Как правило, провайдер к которому подключаются абоненты предоставляет такую услугу, как доступ к своему почтовому серверу новостей и nntp-серверу. Но как получить доступ к информации телеконференций Usenet, котрые не представлены на серверах Вашего провайдера? Есть решение, о котором уже было сказано Выше - обратиться к поисковым серверам. Но есть и еще одно решение - указать в настройках своего агента новостей имя "чужого" сервера новостей (nntp-сервера), к которому обеспечивается свободный доступ. Такие серверы "открытые для всех" (или Public News-Server) существуют в Internet в большом количестве, а их актуальный перечень можно найти, например на таких Web-страницах: http://www.geocities.com/CollegePark/Quad/2554/usenet.htm и http://www.greenline.it/news.htm.

Для поиска открытых серверов новостей существут поисковый механизм, находящийся по адресу http://mserver.lipsia.de/cgi-bin/sdienst/sgroup.cgi, где в качестве запроса вводится название группы новостей. В результате обработки запроса на этом сервере выводится список открытых серверов, поддерживающих запрашиваемую телеконференцию Usenet.

+------------------+
|                  |
|                  |
|                  |
|                  |
+------------------+

Рис.6. Механизм поиска открытых серверов новостей

Перспективы UseNet

Являясь одним из первых сервисов сети Internet (наряду с E-mail), Usenet до сих пор пользуется широкой популярностью. По масштабам использования он уже, конечно, уступает Web, его стремительно догоняет PUSH-технология. При этом технология Usenet, по-видимому, все еще будет оставаться популярной по ряду причин.

Сегодня телеконференции Usenet доступны всем пользователям сети, как в режиме off-line (UUCP), так и в режиме on-line. При этом технологические новшества режима on-line очевидны.

Так популярная сегодня коммерциализация Usenet начала зарождаться именно в телеконференциях relcom.commerce.*, ведущихся по технологии Usenet в России. Этот подход получил должную оценку во всем мире. В последние годы созданны многочисленные группы иерархии biz, а также телеконференции, имеющие в своем названии слова типа "marketplace" и "forsale". Вряд ли коммерсанты откажутся от этой технологии в обозримом будущем.

В то время, как солидные фирмы могут делать доступной свою информацию с помощью широко рекламируемых Web-серверов, то обычные пользователи продолжают вести дискуссии в основном в телеконференциях (наряду с новыми возможностями CHAT) , при этом их мнение становится известно миллионам.

Коммерческое распространение информации с помощью "закрытых" телеконференций (типа Clarinet), ведущихся по технологии Usenet, сегодня по-прежднему оправдывает себя. В Internet разработаны многочисленные программные средства, обеспечивающие удобные и надежные интерфейсы как пользователей, так и администраторов подобных систем.

В заключение можно отметить, что Usenet представляет собой реализацию динамичной, распределенной, нечетко структурированной базы данных, включающей в себя не только текстовую информацию, но и все возможные средства multimedia. Зачастую при проектировании информационных систем, можно использовать не только подходы, но и готовые, апробированные годами, очень недорогие (а зачастую бесплатные) программные средства, используемые в технологии Usenet, для создания достаточно мощных информационно-поисковой сред.


P e к л а м a: [an error occurred while processing this directive]