Александр Юрьевич Чесалов "Методология построения распределенных сетей передачи, обработки и хранения данных: анализ и выбор рациональной структуры. Том 1"

Том 1. Раскрывает классические подходы к проектированию распределенных сетевых структур на основе представленной методики анализа функционирования и выбора рациональной структуры региональной сети передачи, обработки и хранения данных в условиях использования разнородных и низкоскоростных каналов связи с целью повышения производительности, а как следствие, ее эффективности функционирования. В результате проведенных исследований сформирована алгоритмическая и методологическая основа.

date_range Год издания :

foundation Издательство :Издательские решения

person Автор :

workspaces ISBN :9785006014442

child_care Возрастное ограничение : 12

update Дата обновления : 09.06.2023

Ваш, Александр Чесалов.

Сайт: chesalov.com

E-mail: aleksander.chesalov@yandex.ru

01.06.2023

Введение

В настоящее время в России происходит бурный процесс развития информационных технологий проектирования и внедрения компьютерных телекоммуникационных сетей. Одни сети имеют глобальный характер и топологию, другие являются корпоративными или локальными. Характер роста указанных сетей является весьма стохастичным, база средств вычислительной техники, на которой они строятся, гетерогенна. Вместе с тем данные сети имеют мощную тенденцию к расширению и объединению, образуя в конечном итоге интегрированную территориально-распределенную сеть, входящую частично в мировую сеть Internet.

В данной работе в качестве объекта исследования рассматривается региональная сеть передачи, обработки и хранения социально-экономической информации (региональная сеть хранения данных, РСХД), как совокупность технологий построения распределенных сетей и сетей хранения, построенных с применением SAN (Storage Area Network) и NAS (Network Attached Storage). Узлами РСХД являются административный центр и районные центры, представляющие собой сложные аппаратно-программные комплексы, и соединяющие их в единую систему разнородные каналы передачи информации.

Основной задачей РСХД является передача, обработка и хранение больших массивов социально-экономической информации, как основной составляющей всего информационного пространства регионов Российской Федерации.

На данный момент, сетевые территориально распределенные сети занимают важное место в развитии региональной науки и техники, образовании и культуры, здравоохранении, торговли и т. д. Это вызвано, в первую очередь, интенсивным ростом потребностей в распределенных прикладных вычислениях, информационных сервисах, системах электронного документооборота, дистанционного обучения, торговли, использованием почтовых служб, сервисов безопасности передачи, хранения и восстановления данных, и т. д. С другой стороны, недостаток финансирования сетевых проектов со стороны государственных органов, ограниченность средств телекоммуникационных компаний, необходимых для создания единой интегрированной высокоскоростной среды, пока не позволяют создать мощную основу для развития крупной сети регионального масштаба (хотя работы в этом направлении проводятся). Вместе с тем надо, быть готовым к решению задач проектирования и повышения эффективности функционирования и производительности региональных территориально распределенных сетей, на базе уже существующих телекоммуникационных решений, как одной из составляющих общероссийской телекоммуникационной инфраструктуры.

В общем случае моделируемая система РСХД характеризуется территориально распределенной структурой. Несмотря на то, что важнейшим показателем потенциальных возможностей ресурсов сети является пропускная способность центров обработки, передачи и хранения данных, управляемых протоколами TCP/IP, iFCP, iSCSI и InfiniBand, применяемые в настоящее время модели описания процессов сетей SAN являются недостаточно адекватными для проектирования сетей класса РСХД. Кроме того, анализ существующих подходов к решению задачи оптимизации параметров РСХД показывает, что ряд существенных черт, факторов и механизмов, определяющих эффективность функционирования сети, необоснованно упрощается. Таким образом, возникает потребность в создании более совершенных моделей описания процессов функционирования РСХД и методах выбора оптимальных решений, что должно позволить оценить или сформировать набор проектов сетей хранения с тем, чтобы обеспечить возможность выбора приемлемого варианта системы.

Целью работы является разработка методики выбора рациональной структуры региональной сети передачи, обработки и хранения данных в условиях использования разнородных каналов связи с целью повышения производительности, а как следствие, ее эффективности функционирования, посредством выбора методов и совершенствования алгоритмов построения распределенных сетей.

Для достижения поставленной цели в работе решаются следующие основные задачи:

– провести анализ технологий и особенностей построения распределенных сетей хранения данных;

– исследовать модели и методы проектирования распределенных сетей передачи данных;

– предложить комплексную модель региональной сети, представляющую собой совокупность модели функционирования центра обработки информации и системы в целом;

– разработать алгоритмы повышения производительности, а как следствие, и эффективности функционирования системы, и методику выбора рациональной структуры региональной сети передачи, обработки и хранения данных;

– провести анализ и предложить методику определения и оптимизации операционных характеристик сети на протокольном уровне, позволяющую учесть взаимосвязь основных сетевых механизмов процессов передачи данных в условиях использования разнородных каналов связи для региональной сети передачи, обработки и хранения данных;

– провести апробацию результатов исследования;

– разработать предложения и рекомендации по выбору рациональной структуры при проектировании РСХД и повышению эффективности ее функционирования.

Методы исследования

При выполнении работы использовались методы теории вероятностей, теории массового обслуживания, марковских процессов и методы математического моделирования.

Научная новизна работы состоит в следующем:

– проанализированы новые технологии и исследованы подходы к построению распределенных сетей хранения данных и, как следствие этого, предложен подход к выбору рациональной структуры при проектировании региональной сети передачи, обработки и хранения данных;

– разработана модель функционирования региональной сети хранения;

– предложены алгоритмы повышения эффективности функционирования РСХД, используемые при создании структуры, выбора оптимальной пропускной способности каналов, определения характеристик сети хранения и их оптимизации, выбора аппаратного обеспечения на этапе технического проекта;

– разработана методика анализа функционирования и выбора рациональной структуры региональной сети передачи, обработки и хранения данных;

– предложена методика определения и оптимизации операционных характеристик региональной сети хранения на протокольном уровне, позволяющая учесть взаимосвязь основных сетевых механизмов процессов передачи данных в условиях использования разнородных каналов связи.

Достоверность и обоснованность работы подтверждены теоретическими разработками ведущих ученых, которые легли в основу работы, а так же результатами практического использования разработанной методики.

Практическая значимость работы

В результате проведенных в рамках данной работы исследований сформирована алгоритмическая и методологическая основа проектирования региональных распределенных сетей, в условиях использования разнородных каналов связи.

Предложенная методика может быть использована при разработке и реализации сетевых проектов целевых программ информатизации регионов РФ, что позволит ускорить процесс проектирования, снизить финансовые и временные затраты при выборе приемлемого решения, построить или модернизировать региональную сеть, отвечающую предъявляемым требованиям к передаче, обработке и хранению данных.

Внедрение результатов работы

Разработанные модели, методы и программное обеспечение, а также методика его использования внедрены:

– в Администрации Тверской области, при проектировании региональной вычислительной сети обработки социально-экономической информации и при реализации проекта целевой программы информатизации – «Создание опорных пунктов информатизации в районных (городских) администрациях и муниципальных образованьях и отработка функционирования системы взаимодействия на базе внедрения электронного документооборота»;

– в компании «ЛУКойл-Арктик-Танкер» при разработке сетевого проекта построения распределенной системы электронного документооборота компании на базе СУБД Lotus Domino R5.

Апробация работы

Основные положения, теоретические выводы и практические рекомендации работы докладывались автором на следующих всероссийских и международных конференциях: «Математические методы в технике и технологиях» (г. Санкт-Петербург, 2000 и 2001 г.г.), «Социокультурная динамика: философские и социологические проблемы» (г. Тверь, 2000 г.), «Современная образовательная среда» (г. Москва, 2001 и 2002 годы), «Высокопроизводительные Параллельные Вычисления на Кластерных Системах» (г. Нижний Новгород, 2002 г.), на Российском Форуме разработчиков и администраторов информационных систем на базе технологий Lotus от IBM. (г. Москва, 2002 г.).

Публикации

По результатам исследований опубликовано 9 печатных работ:

1. Палюх Б. В., Чесалов А. Ю. Пути оптимизации аппаратно-программной платформы информационной системы. // Математические методы в технике и технологиях – ММТТ-2000: Сб. трудов Международ. науч. конф. В 7-и т. Т.6. Секции 11, 12, 13/ Санкт-Петербургский гос. Технол. Ин-т (техн. Ун-т). Санкт-Петербург, 2000.С.99—100.

2. Федченко С. Л., Чесалов А. Ю. Оценка загрузки и производительности информационной системы с архитектурой клиент-сервер. // Математические методы в технике и технологиях – ММТТ-2000: Сб. трудов Международ. науч. конф. В 7-и т. Т.6. Секции 11, 12, 13/ Санкт-Петербургский гос. Технол. Ин-т (техн. Ун-т). Санкт-Петербург, 2000.С.97—99.

3. Чесалов А. Ю., Чистяков М. В. Направления реорганизации технологической платформы в условиях антикризисного управления. // Управление в условиях кризиса. Социокультурная динамика: философские и социологические проблемы.: Сб. трудов науч. конф. Тверской гос. университет. Тверь, 2000.С.116—123.

4. Палюх Б. В., Чесалов А. Ю. Пути повышения эффективности региональной сети обработки социально-экономической информации. // Международная научная конференция «Математические методы в технике и технологиях» – ММТТ-14: Сборник трудов 14 международной научной конференции. Том 6. Секции 7,8 / Смоленский филиал Московского энергетического института (технического университета), Смоленск, 2001. C. 104—105.

5. Федченко С. Л., Чесалов А. Ю. Построение комплекса взаимосвязанных моделей для синтеза корпоративных вычислительных сетей. // Международная научная конференция «Математические методы в технике и технологиях» – ММТТ-14: Сборник трудов 14 международной научной конференции. Том 6. Секция 8 / Смоленский филиал Московского энергетического института (технического университета), Смоленск, 2001. C. 147.

6. Виноградов С. Н., Палюх Б. В., Чесалов А. Ю. Метод анализа функционирования информационной системы социально-экономических показателей Тверской области. // Международная научная конференция «Математические методы в технике и технологиях» – ММТТ-14: Сборник трудов 14 международной научной конференции. Том 6. Секции 8 / Смоленский филиал Московского энергетического института (технического университета), Смоленск, 2001. C. 126—128.

7. Прохныч А. Н. Чесалов А. Ю. Разработка автоматизированной информационной библиотечной системы на базе Domino R5. // Российский Форум разработчиков и администраторов информационных систем на базе технологий Lotus от IBM.: Сборник трудов Российского форума на CD-Rom / Академия Госслужбы при президенте РФ, Москва. 2002.

8. Чесалов А. Ю. Комплексный подход к построению и оптимизации кластерных вычислительных сетей. // Международный научно-практический семинар и всероссийская молодежная школа «Высокопроизводительные Параллельные Вычисления на Кластерных Системах»: Сборник трудов 2 международного научного семинара. / Нижегородский государственный университет им. Н. И. Лобачевского, г. Нижний Новгород, 2002. С. 329—333.

9. Чесалов А. Ю. Методы выбора вычислительных средств при проектировании кластерных вычислительных сетей. // Международный научно-практический семинар и всероссийская молодежная школа «Высокопроизводительные Параллельные Вычисления на Кластерных Системах»: Сборник трудов 2 международного научного семинара. / Нижегородский государственный университет им. Н. И. Лобачевского, г. Нижний Новгород, 2002. С. 333—338.

Глава 1

Анализ проблем повышения эффективности функционирования региональной сети передачи, обработки и хранения данных (РСХД): Аналитический обзор и Постановка задачи

1.1 Актуальность проектирования и повышения эффективности региональных сетей

Информационные ресурсы являются одним из важнейших видов ресурсов для всех без исключения органов управления, в том числе и для областных органов государственной власти. Внедрение информационных систем представляет в настоящее время процесс, который происходит и в России, и за ее пределами, и отражает динамику и сложность экономики, расширяющиеся международные связи и кооперацию по решению ряда экономических, социальных и политических задач [[11 - .Юрасов П. В. Алгоритмизация оптимального проектирования информационных сетей на основе слабосвязных графов: Автореферат диссертации на соискание ученой степени канд. техн. наук: 05.13.12. -Воронеж, 2000. -17 с.: ил. – Библиогр.:с. 16—17.],[12 - .Лясковский Ю. К. Frame Relay – путь к цифровой суперсвязи. Журнал «Сети» №7, 1995.]].

Анализ ситуации в регионах РФ показал, что в большинстве из них сетей передачи, обработки и хранения данных, в полном понимании рассматриваемой в работе концепции региональных сетей не существует. Например, в более чем 50% районах Тверской области отсутствуют высокоскоростные каналы передачи данных, более 80% устаревшего сетевого и серверного аппаратно-программного обеспечения и т. д. [[13 - .Советов Б. Я., Яковлев С. А. Построение сетей интегрального обслуживания. Л.: Машиностроение, 1990.]].

Во многих странах создана и действует информационная индустрия с мощной инфраструктурой, обеспечивающей необходимую поддержку большого числа баз данных о различных видах деятельности общества на базе широкого использования технологий распределенных сетей хранения данных – SAN и NAS.

Опыт ведущих стран показывает, что в процессе информатизации для получения результата необходимо, в первую очередь, решить проблемы учета имеющихся трудовых, финансовых и материальных ресурсов, в виде соответствующих социально – экономических баз данных. В этом случае появляется возможность решать вопросы комплексного развития территории на основе анализа многоаспектной информации.

Кроме того, постоянное развитие и увеличение информационно-технического потенциала предприятий и учреждений, потребностью управления корпоративными сетями инициирует потребность к территориально распределенной информационной интеграции с использованием сети Internet и технологий РСХД, что приводит к резкому увеличению передаваемого по сети трафика в условиях использования, как правило, низкокачественных и низкоскоростных линий связи и необходимости хранения больших массивов данных. Следствием этого, стабилизация и совершенствование социально-экономической сферы регионов требуют поддержки, совершенствования и развития региональных сетей передачи, обработки и хранения данных.

РСХД предъявляют высокие требования к эффективному использованию средств передачи данных и уровню обслуживания клиентов сети. В связи с этим, одной из важнейших проблем, которую приходится решать при проектировании и внедрении сетевых проектов и их эксплуатационном сопровождении, является проблема адекватного описания процессов в моделях, используемых при проектировании и организации эффективной работы распределенных региональных сетей в различных условиях функционирования.

На сегодняшний день задача построения региональной сети передачи, обработки и хранения данных стоит достаточно остро не только для отдельно взятого региона, но и имеет большое практическое значение для большинства регионов Российской Федерации.

1.2 Обзор технологий построения и проблемы организации эффективного функционирования РСХД

За последние годы появилось много новых разработок в области сетевого хранения данных. На сегодняшний день выделяют две концепции построения РСХД: первая – Network Attached Storage (NAS) и вторая, быстро развивающаяся, Storage Area Network, базирующихся на трех основных стандартах (протоколах), которые используются для организации РСХД – Fiber Channel, SCSI, InfiniBand и их модификациях для RNAS – iFCP, iSCSI [[14 - .Назаров В. М. Принципы построения и развития региональной информационной вычислительной системы: Автореферат диссертации на соискание ученой степени канд. техн. наук:05.13.13. -Пенза, 1997. -18 с. – Библиогр.: C.16—17.],[15 - .Бертсекас Д., Галлагер Р. Сети передачи данных. М.: Мир, 1989.]].

Несмотря на то, что для построения РСХД в девяноста восьми случаях из ста используется технология Fiber Channel условная грань, разделяющая технологии хранения на сетевые устройства, постепенно стирается, а рынки альтернативных технологий расширяются (рис.1).

Рисунок 1. Сегментация рынка SAN

Одной из наиболее заметных тенденций в развитии распределенных сетей стало резкое увеличение спроса на сетевые устройства хранения. По прогнозам аналитической компании Yankee Group, в 2002 году доход от реализации систем хранения SAN вырос на 12,6% по сравнению с показателями предыдущего года, а к 2005 году он составит 8,56 млрд. долларов.

Рассмотрим три основных технологии, которые могут быть положены в основу региональной сети хранения данных.

Fiber Channel – технология передачи данных на уровне блоков (в отличии от передачи на уровне файлов) с предоставлением качества и класса услуг, включая гарантированную доставку пакетов. Данная технология позволяет осуществлять доступ к данным на уровне блоков быстрее, чем на уровне файлов, и дает возможность решить проблемы с безопасностью и перегрузкой системы. К недостаткам технологии Fiber Channel можно отнести то, что она поддерживает передачу данных на расстояния не более 10 км. С целью решить данные проблемы в Lucent Technologies и Cisco была разработана новая технология Fiber Channel IP (FCIP). Но анализ показал, что технология FCIP хоть и удовлетворяет требованиям гарантированной доставки, однако туннелирование в TCP/IP может стать серьезным препятствием, поскольку процедура обработки инкапсулированных пакетов способна негативно повлиять на эффективность и скорость системы в целом.

Альтернативой FCIP для построения РСХД служит протокол iFCP (Internet Channel Protocol), предложенный компанией Nishan, в основе которого лежит технология IP. Он предназначен для соединения шлюзов на базе TCP/IP, при котором Fiber Channel отображается на IP. Важно отметить, что iFCP предполагает замену коммутаторов и маршрутизаторов Fiber Channel на системы на базе IP, сохраняя способность связывать устройства Fiber Channel через IP. Данная технология может использоваться, как связующее звено между распределенными сетями передачи и обработки информации, так и в рамках сетей Fiber Channel [[16 - .Кларк Э. Fiber Channel, IP и некоторые другие технологии в сетях хранения. М: LAN, 2002, №7, С.36—41.]].

iSCSI (Internet SCSI) – технология позволяющая передавать команды SCSI поверх протокола IP и предназначена для передачи данных на уровне блоков с применением устройств, поддерживающих ленточные библиотеки и дисковые массивы, а также хост адаптеры и коммутаторы IP. Данная технология была разработана и поддерживается IBM, Cisco и Storage Networking Industry Association. Его применение позволяет с помощью сети IP объединить территориально распределенные центры обработки информации региональной сети, с одной стороны, и и устройства хранения данных – с другой, решив тем самым проблему удаленного доступа к данным, а в последствии и резервного копирования из любого сегмента региональной сети. Технология iSCSI позволяет также одновременно организовать несколько каналов ввода/вывода между несколькими конечными устройствами при наличии всего одного порта Ethernet. Но широкое распространение данного протокола ограничивается пропускной способностью существующих сетей IP, которой может быть недостаточно для обеспечения доступа к хранимой информациис требуемыми параметрами. Исходя из этого, для снижения задержек и возможных ошибок для передаваемых блоков данных (команд SCSI) существующие сети должны быть адаптированы для работы iSCSI [[17 - .Ковалев В. Резервное копирование данных в среде SAN. М: LAN, 2002, №7, С.36—41.]].

InfiniBand – технология, осуществляющая передачу данных на скорости 2,5 Гбит/с, разработанная компанией Intel и поддерживаемая Dell, IBM, Hewlett-Packard, Microsoft и Sun Microsystems. Спецификация InfiniBand описывает коммутируемую архитектуру «точка-точка», обеспечивая множеству устройств ввода/вывода возможность посылки одновременных запросов к процессору системы таким образом, чтобы в процессе передачи данных не возникло «узких» мест. Ее применение направлено на повышение производительности и масштабируемости кластерных систем хранения и обработки данных, а также подсистем РСХД.

Похожие книги


Все книги на сайте предоставены для ознакомления и защищены авторским правом