www.gcs.ru
+7(495) 729-51-70 (ГКС)
Инновации хранения данных IBM
Как инновации в хранении информации помогают расти?

IBM: Нужно быть готовыми к взрывному росту требований к производительности систем

Земная ноосфера превращается в «цифровую вселенную»: для поддержания нормальной жизни человечеству необходимы вычислительные устройства, связь и огромные объемы информации, которые удваиваются каждые полтора-два года. Системы хранения и обработки данных нуждаются в постоянном апгрейде, и нужно что-то радикально менять. Сергей Касаев, руководитель отдела систем хранения данных IBM в России и СНГ, считает, что справиться с потоком данных поможет флэш-память.

CNews: Какие мировые тренды определяют сегодня направление развития технологий хранения информации?
Сергей Касаев:

Самый важный тренд – это взрывной рост объемов данных. Он продолжается уже давно, и пока нет никаких признаков того, что влияние этого тренда будет снижаться. Если оценивать его в разрезах корпоративных и общедоступных данных, то быстрее всего, конечно, растут объемы общедоступной информации. Я, например, сегодня ехал в метро – насчитал человек десять пассажиров, которые подключились к интернету через Wi-Fi и смотрели видео онлайн.

Поэтому все компании, обладающие данными, ищут способы их эффективно хранить и обрабатывать, а задача IBM – предложить им новые решения. Новые, потому что старый подход уже неконкурентоспособен и неэффективен.

Раньше, если появлялась какая-то новая задача, связанная с хранением данных, то покупался дисковый массив с расчетом на рост объемов, например, на 10–15% в год. Сейчас же в корпоративном сегменте объем данных, необходимых для бизнес-аналитики, может возрастать в три, пять, десять раз за год. И это приводит не только к увеличению хранилищ, но и к более высоким нагрузкам на информационные системы компании. Например, когда розничный банк выпускает мобильное приложение, большое количество подключившихся пользователей создает нагрузку на АБС.

CNews: Что можно сделать в такой ситуации?
Сергей Касаев:

Нужны новые подходы. IBM видит несколько ключевых направлений, по которым будет развиваться рынок хранения информации. Первое – это, естественно, флэш-технологии. Они позволяют отказаться от механических жестких дисков в пользу емких сверхбыстрых чипов.

Второй подход – использование программно определяемых технологий, в данном случае это SDS – Software-defined Storage – и все, что с ними связано: программно конфигурируемые дата-центры, сети и так далее.

И третье – облака. Конечно, разговоры о них уже набили оскомину, да и под облачными технологиями каждый понимает что-то свое, но давайте посмотрим на то, что делает IBM. Недавно она купила компанию Cleversafe, обладающую перспективной технологией хранения гигантских объемов данных – я подразумеваю под этим десятки петабайт. Почему это важно для IBM? Если дома вы делаете бэкап или копируете на другой диск свои фотографии, то процесс идет быстро. Но когда речь идет о петабайтах, то дублирование информации приводит к тому, что нужно удваивать объемы хранилища, а это дорого. Поэтому для нас ценна технология Cleversafe, позволяющая так организовать хранение, что не требуется делать несколько копий данных.

CNews: Это нужно для обработки больших данных, того, что называется Big Data? Или вы солидарны с Gartner в том, что тренд больших данных умер?
Сергей Касаев:

Нужно правильно понимать термин «большие данные», он появился не на пустом месте. Тренд заключался в том, что требовалось очень быстро обрабатывать огромные объемы информации. Возьмем для примера поисковые системы: по мере того, как вы вводите ключевые слова, система вам предлагает различные варианты популярных запросов, похожих на ваш. За это короткое время происходит анализ колоссальных объемов информации.

Было создано много решений для сбора и анализа больших данных. Но затем это понятие стало постепенно трансформироваться. Заказчики, слушая поставщиков технологий, думали в первую очередь о том, что анализ данных должен помогать им принимать управленческие решения и управлять бизнесом.

На сегодняшний день, по моему мнению, большие данные трансформировались и влились в такое понятие, как цифровой бизнес. Это более широкий термин, объединяющий целый спектр направлений. А сама технологии не умерла – даже решения на ее основе остались востребованными. Просто сейчас постепенно идет ее трансформация и интеграция в новые бизнес-модели.

CNews: Как можно оценить экономическую эффективность флэш-технологий, и каковы их перспективы в России?
Сергей Касаев:

Многие даже не представляют, насколько это просто оценить. Вспомните, как мы храним информацию на жестких дисках. Если ее много, мы архивируем файлы, сжимаем их. Это неудобно, потому что для обращения к данным их нужно сначала разархивировать. Если бы у вас появилась возможность сжимать данные «на лету», вы бы с удовольствием это использовали. Точно так же думают и заказчики корпоративных ИТ. Поэтому появилось много технологий сжатия данных, дедупликации.

Важное качество флэш-технологий заключается в том, что в отличие от жестких дисков нет заметного падения производительности при росте нагрузки. То есть, некоторое снижение есть, но оно не влияет на работу, потому что изначально запас производительности такой, что он не станет ограничивающим фактором и через 10 лет.

Нагрузка на вычислительные системы, связанные с обработкой информации, год от года будет только расти. Нам придется обеспечить взрывной рост производительности систем, и к этому нужно быть готовым
Сергей Касаев
руководитель отдела систем хранения данных IBM в России и СНГ

В России IBM стала одним из первых поставщиков систем хранения данных, в которых флэш-память использовалась вместо жестких дисков, и эта технология стала очень активно внедряться. У нас есть, например, крупный заказчик, который уже использует более 50 флэш-систем. И, судя по общим темпам, Россия не просто не отстает от остального мира – она даже быстрее внедряет флэш в СХД, чем это раньше делал Запад.

Это связано в том числе с тем, что наш рынок ИКТ-инфраструктуры моложе западного, у нас не так много старых решений, от которых нужно отказываться в пользу нового, а это всегда нелегко.

Вообще процесс продажи флэш-систем хранения данных в России очень простой. Мы предоставляем компании демонстрационную машину, максимум за неделю производятся ее интеграция в инфраструктуру и миграция данных, а затем система работает одну-две недели до принятия решения насчет покупки. Все остальное – это вопрос выделения финансов. У нас даже были случаи, когда демо-машину заказчики просили оставить подольше, пока они не закроют финансовый год. Они просто видели результат – процесс обработки данных вместо двух-трех дней занимал полчаса.

Что касается финансовых затрат, цена флэш-памяти значительно снизилась за последние годы. Уже можно смело сказать, что флэш – это недорого. При грамотном расчете стоимости владения можно увидеть, что флэш-технологии уже соперничают с SaaS-решениями. Нужно только считать все выгоды, включая оптимизацию – сжатие данных, дедупликацию и так далее. Нужно сравнивать энергозатраты, размеры занимаемого места. И я могу сказать, что часть ключевых заказчиков уже приняла решение переходить на флэш-технологии, постепенно заменяя существующие массивы. Это нормальный эволюционный путь развития.

CNews: Какие перспективы видит IBM у программно конфигурируемых хранилищ и дата-центров?
Сергей Касаев:

Сейчас чуть ли не все компании говорят о программно определяемом подходе, и это объяснимо. Уже множество поставщиков предлагает свои системы хранения данных, не производя аппаратные решения. Они продают программный продукт, который клиент может использовать в своей инфраструктуре. Его легко модернизировать, добавлять функциональность в результате простой перепрошивки «железа».

Компания IBM задумалась над этим еще в 2002 году, выпустив продукт для виртуализации СХД. И мы имеем сейчас 14-летний опыт разработки таких систем. Сейчас выпускаются новые продукты, делаются новые анонсы, но никакой революции не произошло, эти технологии уже были, только иначе назывались. Мы используем накопленный опыт, опираемся на него и не отказываемся от старых решений со словами «раньше все было неправильно – покупайте теперь то, что правильно».

Уникальность ситуации в том, что сейчас можно поставить продукт 2002 года, обновить ПО и дальше им пользоваться. Это значит, что, не меняя ничего в ИТ-инфраструктуре, компания получит новые, современные функциональные возможности. Обращаю внимание, что это не исправление ошибок, а серьезные обновления, которых раньше не существовало. Например, вы сделали апдейт, и ПО сжало все ваши данные в два раза. Значит, вы можете еще какое-то время не тратить деньги покупку оборудования для расширения хранилища.

Если говорить о запросах заказчиков систем хранения данных, то их можно разложить на три категории: флэш-системы, программно конфигурируемые решения и построение частных облаков, оптимизация ИТ-инфраструктуры.

CNews: Настолько перспективны и доступны облачные хранилища корпоративных данных, кто будет главным заказчиком?
Сергей Касаев:

Это один из самых сложных вопросов, потому что российский рынок сильно отличается от западного. Там облака используются давно, и бизнес не видит проблем в том, чтобы доверять поставщикам облачных сервисов.

Клиентов привлекает возможность разумно вкладывать средства в ИТ, используя облака, потому что они позволяют гибко управлять ресурсами. Нет ни одного заказчика в крупном бизнесе, который не думал бы над тем, как это использовать. Но в России я вижу, что все еще существует своего рода ментальный барьер, наши компании привыкли все свои данные держать у себя.

На этом направлении IBM видит большой потенциал роста не у публичных, а у гибридных облаков, когда заказчик для чувствительных данных строит частное облако на своей инфраструктуре, а остальные данные отдает в публичное облако.

CNews: Как развитие Интернета вещей повлияет на технологии хранения и обработки информации?
Сергей Касаев:

Развитие Интернета вещей – одна из главных задач, которые решает IBM. Все понимают, в чем его польза: вы можете, например, приехать на машине домой, отпустить ее, после чего она сама найдет парковку, оплатит ее, простоит ночь, а утром будет ждать вас у подъезда.

Но есть проблема, связанная с тем, что экспоненциально возрастет объем информации, подлежащий обработке. Сегодня один пассажирский авиалайнер за время полета генерирует гигабайты данных, представьте, что таких вещей станет огромное количество. Миллионы самолетов, машин будут «общаться» друг с другом, перестраиваться, предотвращать аварии…

Мы также придерживаемся мнения, что Интернет вещей – это часть эволюции человека. Одно из основных направлений его развития – здравоохранение, и здесь использование носимой электроники, чипов приведет к драматическим изменениям человеческого уклада жизни.

Большие перспективы IBM в разработке систем анализа таких потоков информации связаны, в основном, с ее собственными технологиями, на которых был построен суперкомпьютер IBM Watson. Кстати, мы недавно упоминали, что IBM приобрела один из главных гидрометеоцентров Америки – компанию Weather Company. Как думаете, зачем она это сделала?

CNews: Потому что предсказание погоды – это очень ресурсоемкая задача, ей обычно и занимаются суперкомпьютеры
Сергей Касаев:

Ресурсы – это не такая большая проблема. Главное отличие Weather Company от других компаний в том, что она использует около миллиарда датчиков для предсказания погоды. И колоссальный поток информации, который они генерируют, – идеальная площадка для отработки технологий. Watson будет на них «тренироваться», анализируя информацию. После того, как IBM научится работать с этим материалом, будет намного проще двигаться дальше.

Если оценивать Интернет вещей с точки зрения ИТ, то я не думаю, что его развитие приведет к взрывному росту объема хранимой информации в мире. Да, поток данных от датчиков будет огромным, но нет нужды его хранить. Нам абсолютно неважно, что показывал такой-то датчик 10 лет назад – нам важно, какая была погода, как ее предсказывали и с какой точностью. Хранить необходимо только результаты, а не первичные данные. Но нагрузка на вычислительные системы, связанные с обработкой этой первичной информации, год от года будет только расти. Нам придется обеспечить взрывной рост производительности систем, и к этому нужно быть готовым.

Павел Притула