IT уже давно является драйвером повышения эффективности, но сейчас, как никогда, от IT зависят успехи в исполнении долгосрочной стратегии, говорят в Сбербанке. Большая роль тут отводится созданию масштабируемой и надежной инфраструктуры, которая должна удовлетворять растущим потребностям банка. О перспективах развития IT-направления банка и достижениях в этой сфере рассказал член правления, старший вице-президент Сбербанка России Виктор Орловский.
Вы уже почти пять лет работаете в банке. Что оказалось самым неожиданным и сложным?
Виктор Орловский: Самым сложным оказался, как ни странно, масштаб и самого банка, и тех преобразований, которые мы начали делать. Сбербанк, конечно, и с наружи кажется большим, но его размеры и инерцию понимаешь только когда попадаешь внутрь. Изнутри этот "корабль" и правда является необозримо большим.
Очень много областей в банке требовали немедленных преобразований - часть задач как бы лежала на поверхности, но понимание глубины проблем во многом стало понятно по мере распутывания каждой отдельной проблемы и формулирования задачи. И при этом каждая поставленная задача должна быть соотнесена (синхронизирована) с остальными, потому что процессы в банке и функции сильно интегрированы, и задачи влияют неизбежно одна на другую.
Вместе с этим те немедленные преобразования, которые были сделаны, позволили очень быстро нарастить объемы продуктов и операций, запустить новые виды продуктов и услуг. Сеть, которой обладает Сбербанк, позволяет наращивать объемы очень быстро. Этот масштаб также было сложно учесть. Теперь я понимаю, что размер организации и масштабы преобразований имеют колоссальное значение и нельзя подходить с одной и той же меркой к разным задачам. Для управления в Сбербанке требуются особые методы работы и особое внимание к нарастающей сложности преобразований, даже тогда, когда создается иллюзия отсутствия каких-либо ограничений.
Сбербанк сегодня обслуживает 102 миллиона уникальных клиентов, более миллиона корпоративных клиентов, проводит операции по более чем 400 миллионов счетов - около 30 миллионов онлайн клиентских транзакций в сутки, более 150 миллионов операций в день. Одних sms мы отправляем клиентам около 800 миллионов в месяц. Мы сталкиваемся со значительными технологическими сложностями. Особенности работы наших IT-систем состоят в том, что практически все они работают под очень высокой нагрузкой - каждая поэтому обладает своим уникальным набором характеристик, иногда за границами того, что предлагают современные банковские технологии.
Сегодня мы испытываем на себе те проблемы IT-архитектуры, до которых многие наши конкуренты в России и в мире просто не доходят с точки зрения требований к производительности и масштабируемости систем. Мы значительно больше в этой связи похожи на Amazon, FaceBook и e-bay. Но они развивались с нуля в начале XXI века, когда технологии уже позволяли создавать системы нового поколения (с горизонтальной масштабируемостью, использованием передовых технологий интеграции), в то время как нам приходится нести на себе груз, уходящий своими корнями в начало 90-х.
Многие крупнейшие мировые производители аппаратного и программного обеспечения удивляются, что у нас проявляются такие "странные" проблемы, которых больше нет ни у кого. Они признают, что мы используем программно-аппаратные возможности систем на пределе их максимальной производительности, а законы работы в этих предельных нагрузках совершенно другие.
Раньше подход к внедрению систем в Сбербанке был децентрализованным, и нагрузка на них была распределенной. Но такая идеология не позволяет быстро выводить на рынок новые продукты и услуги, а также является достаточно дорогой и трудоемкой в сопровождении. Сейчас мы внедряем только полностью централизованные системы и активно централизуем те, которые были установлены ранее. В результате возрастает скорость внесения изменений и развития продуктов и услуг, понижается себестоимость операций, но одновременно резко возрастают требования к масштабируемости и надежности систем.
Мы изо дня в день сталкиваемся с задачами в этой области - как увеличить производительность, обеспечить линейное масштабирование и не уменьшить надежность при внесении непрерывных функциональных изменений в наши системы. Например, наш интернет-банк для частных клиентов за год нарастил базу на 1,5 миллиона человек, еще через год у нас было более 4 миллионов, и количество клиентов продолжает расти опережающими темпами. Другие крупнейшие банки за тот же период прирастили базу на 200-400 тысяч клиентов. А мы этот путь прошли меньше чем за квартал. И у них было время нарастить ресурсы системы для поддержки роста, а у нас не было. Кроме того, мы не имеем права останавливаться. Сбой в наших системах (например, процессинг банковских карт) может парализовать банковскую систему всей страны, а остановка расчетной и депозитной систем могут привести к социальному взрыву (невыплата пенсий, пособий, зарплат бюджетникам и т.д.). Груз ответственности в этой связи на нас лежит колоссальный.
Недавно мы посетили по приглашению руководства компании Боинг их заводы в Сиэтле. Я был впечатлен тем, как организован процесс изменений в этой компании. Мы очень во многом похожи на Боинг. Для нас так же, как и для Боинга, самое главное - это надежность систем и технологий. Мы также, как и они, рискуем своей репутацией, если технологии не будут обеспечивать надежного функционирования систем. Для этого нужна надежнейшая, отказоустойчивая и неограниченно масштабируемая инфраструктура.
И как вы решаете эти проблемы?
Виктор Орловский: Наши методы повышения надежности, производительности и масштабируемости систем эволюционировали с течением времени. Однако не скажу, что уже достигли в этом вопросе совершенства, думаю, настоящий прорыв впереди. Тем не менее, многое сделано. Во-первых, мы тщательно проработали все системы на архитектурном уровне. Сейчас разрабатываем систему раннего мониторинга и оповещения о критических нагрузках на узлы системы - в этом направлении работает отдельная команда высококвалифицированных специалистов.
Очень много делаем в области построения отказоустойчивой архитектуры приложений. Работаем напрямую с производителями программных и аппаратных средств и прикладного ПО, тем самым повышая надежность и производительность систем. Как правило, каждая система - это набор компонент различных производителей. Поэтому организовываем команды, работающие над проектом наиболее сбалансированным образом. В ближайшее время наши крупнейшие партнеры развернут в Сколково вместе с дочерней компанией Сбербанка "Сбербанк-Технологии" центры компетенций, которые будут вырабатывать, пилотировать и внедрять решения, позволяющие достичь максимальной масштабируемости, производительности и надежности.
Но главное - это внедрение в организации культуры, которая должна отражать простое правило для всего, что мы делаем, - надежность, масштабируемость решений и производительность систем, а также их информационную безопасность. Это те качества наших технологий, которые не должны быть компромиссом по отношению к функциональности выводимых на рынок новых продуктов и услуг. Этот приоритет должен быть приоритетом для всей организации в целом, а не для отдельных ее частей.
Мы стараемся внедрить именно такую культуру в нашу организацию.
Для мировых производителей аппаратных и программных платформ работа со Сбербанком - это своеобразный тест, сродни гонкам на выживание в Дакаре или Ле-Мане. Часто нигде в мире кроме как в Сбербанке производители не могут испытать столь экстремальный режим работы. Мы находимся в постоянном контакте с первыми лицами ведущих мировых компаний, под наши задачи разрабатываются следующие серийные версии систем.
Есть ли примеры, когда выбор IT-решений был действительно определяющим для дальнейшего развития банка?
Виктор Орловский: Я приведу два примера. Первый связан с Центром обработки данных (ЦОД). Строительство такого сооружения - это очень большие инвестиции "вдолгую". Мы решили строить два ЦОДа - основной и резервный в Москве и Подмосковье. Почему именно Москва и Российская Федерация? Причин несколько: во-первых, мы - государственный банк, и все данные о банке и о наших клиентах должны оставаться в РФ. А в России такой инфраструктуры в нужном нам объеме и нужными параметрами качества нет. Во-вторых, такая площадка позволяет нам быстро и практически неограниченно наращивать ресурс, что важно для быстрого развития.
Выбрали Москву еще и потому, что есть некоторые технологические особенности наших IT-решений, требующие онлайн-репликации данных между ЦОДами, так что они должны находиться на расстоянии не более 60 км друг от друга. Кроме того, в Москве сосредоточены все коммуникации, а это основное узкое звено всех централизованных решений (а надежность всей системы в целом, как известно, ограничена ее самым узким местом). Строим ЦОДы по международным стандартам UPTIME Institute - это гарантия качества. Мы посчитали, что экономия при запуске ЦОДа на полную мощность составит по сравнению с децентрализованной моделью 500 миллионов долларов в год.
В 2008 году была дискуссия "строить" или "не строить". Но я уверен: приняли правильное решение. Данная инфраструктура позволит нам наращивать объемы и внедрять новые технологии без потери качества и гарантировать надежность ежедневной ее эксплуатации. Для обеспечения полной надежности нам предстоит построить 2-й ЦОД в Сколково. Тогда проблема построения корневой инфраструктуры будет закрыта для нас на 10 следующих лет.
Вторым эпохальным для нас событием стал выбор аппаратной платформы для программы централизации основных систем (core banking platform) территориальных банков. Мы выбрали два комплекта систем (две корпоративные и две розничные платформы, каждая - работающая в связке друг с другом). Совокупный объем их операций составит около 150 миллионов транзакций в день - это колоссальная величина. Базу данных нам поставила компания Oracle - мировой лидер в построении систем управления БД.
Что касается программно-аппаратной платформы, то у нас был выбор между решениями класса MainFrame (суперкомпьютеры), технологиями распределенной обработки данных и технологиями в так называемой SMP архитектуре (симметричная многопроцессорная обработка) на RISK серверах и возможностью использования горизонтально масштабируемой архитектуры на платформе х86. После долгого и кропотливого анализа мы отказались от решений класса MainFrame. Основные причины: проприетарная технология одного производителя - переходя на нее, мы лишаем себя возможности маневра в перспективе 7-10 лет. У многих крупнейших банков, которые используют данные технологии, есть многомиллиардные программы по переходу на другую инфраструктуру. Системы параллельной многопроцессорной распределенной обработки данных, такие как Oracle SuperCluster, выглядят наиболее привлекательными и инновационными, позволяют достичь высокой скорости обработки данных и стандартизации платформ. Но такие системы только появляются на рынке, и быстрый переход на них для таких суперкритичных приложений, как core-banking, также невозможен - требуется комплексное тестирование всех прикладных систем и их доработка под данную платформу.
Мы будем тестировать данную платформу и поэтапно переводить на нее целый ряд наших систем. Кроме того, тестируем платформу х86 с горизонтальным масштабированием инфраструктуры для ряда задач. Но такие решения для core-banking требуют кардинальной перестройки самой ее архитектуры и перевода систем в режим работы с распределенной базой данных и асинхронным режимом взаимодействия модулей систем между собой. Такой проект возможен, но его реализация займет 5-7 лет, а у нас в момент выбора не было такого запаса времени. Оставлять же core banking системы в неизменном, нецентрализованном виде мы не могли, так как количество и интенсивность функциональных изменений постоянно растет, появляются новые системы, усложняется их совместная интеграция. Большое количество систем core banking препятствует такому процессу и является существенным ограничением.
В итоге, для развития систем core-banking и программы централизации мы остановились на технологиях SMP (RISK). Это проверенная временем и развивающаяся технология, на сегодняшний день лучшая платформа для баз данных Oracle. Мы провели мультвендорный конкурс, детальное исследование и тестирование платформ трех основных производителей: Oracle/SUN, HP, IBM. Лучшую производительность и масштабируемость показала платформа IBM (p-series) на процессорах Р7, которая была выбрана основой для программы централизации. В качестве дисковых массивов в программе используются решения от HP.
Несколько слов о проекте ЦОД "Южный порт" - масштабы, уровень качества, стоимость?
Виктор Орловский: Следует отметить, что этот проект является самым крупным банковским ЦОДом (общая площадь машинных залов - 5000 кв. м) в Центральной и Восточной Европе. Он сертифицирован в Uptime Institute по уровню надежности Tier III. Данный уровень позволяет не только проводить регламентные работы по инженерно-техническим системам без прекращения функционирования ЦОД, но и иметь его безотказную работу при возможных сбоях в системах. ЦОД централизует информационные ресурсы всех территориальных отделений Сбербанка, что позволит максимально эффективно осуществлять информационную поддержку подразделений, занимающихся обслуживанием клиентов, и в разы увеличить производительность вычислительных процессов.
Решения, используемые при создании Центра, базируются на самых высокопроизводительных энергосберегающих технологиях, соответствующих лучшим мировым практикам. Расчетная экономия расходов банка на сопровождение инфраструктуры IT, начиная с 2015 г., составит около 500 млн долларов в год. Срок окупаемости проекта - порядка 2,5 года . Что касается инвестиций в проект, то в расчете на одну стойку (или квадратный метр машинного зала) мы инвестировали примерно столько же средств, сколько инвестируют в подобные проекты в мире (данные цифры хорошо известны специалистам). Важно понимать, что за 10 лет эксплуатации ЦОДа при нагрузке 60% около 75% совокупной стоимости владения ЦОДом составляют затраты на электричество. Поэтому эффективность тепловыведения является ключевой для ЦОДов.
Были ли применены инновационные решения в проекте?
Виктор Орловский: Уникальные и инновационные технические решения, примененные Сбербанком в проекте ЦОД "Южный порт", основаны на эффективности использования энергии и ресурсов. Благодаря этому, энергоэффективность ЦОД "Южный порт" Сбербанка была высоко оценена аудиторией симпозиума Uptime Institute (прошедшим в г. Санта-Клара, Калифорния, США, в мае 2012 года).
Проект ЦОД "Южный порт" удостоен международной премии Green Enterprise IT Awards 2012 (GEIT) в номинации "Реализация инновационных технологий энергосбережения в инфраструктуре предприятия". И это при том, что Москва находится в экстремальной температурной зоне с диапазоном годовой температуры от -35 до +40 С, что значительно осложняет получение столь высоких показателей энергосбережения.
Мы активно применяем новые технологии, такие как виртуализация, параллельная обработка данных, кластерные технологии обработки данных в режиме реального времени. Очевидно, что ключом к решению задач повышения производительности, масштабируемости и надежности систем является комплексный всесторонний подход - в системах не должно быть сразу несколько "узких мест". А те ограничения, которые есть, должны быть досконально изучены и найдены пути их долгосрочного устранения.