Центр основан с целью создания структуры для диагностики редких заболеваний. Один из первых случаев, диагностировавшихся в этом центре — две сестры, страдающие схожими дегенеративными заболеваниями. Одна из сестер уже не могла обходиться без инвалидного кресла, а у второй наблюдались признаки того, что в скором времени она также не сможет передвигаться самостоятельно. Прежде чем обратиться в центр, сестры посетили более 32 специалистов за пять лет.

После секвенирования геномов обоих сестер специалисты нашли мутацию, которая передалась девочкам по наследству. Эти данные помогли врачам разработать лечение и кардинально изменить ситуацию. Это стало возможно благодаря технологиям, позволяющим проводить быстрый анализ генома.

Центр использует передовые технологии, которые помогают ускорить секвенирование генома. Процесс занимает 48 часов, но это самый быстрый способ анализа генома в мире. В работе задействованы передовые алгоритмы, современные средства хранения и упорядочивания данных. Сфера интересов Центра постепенно растет: сегодня, кроме редких заболеваний, в нее входят скрытые в геноме причины рака и фармакогеномика.

Волна данных

Секвенирование генома — процесс, связанный со сложными вычислениями и интенсивной обработкой данных, требующий достаточных вычислительных мощностей и объемных хранилищ. Сегодня количество данных, хранящихся и обрабатываемых в Центре, растет в геометрической прогрессии. Всего семь секвенсоров позволяют анализировать 64 генома за шесть дней, данные по одному геному занимают около 170 гигабайт. Это приблизительно 11 терабайт исходных данных в неделю. Расширение сферы деятельности и работа с раковыми больными еще больше увеличили нагрузку на оборудование Центра.

Центр вложил значительные средства в компьютеры с высокой производительностью. На сегодняшний день на благо медицины трудятся более 40 узлов под контролем Linux, а суммарное число задействованных ядер превышает 1300.

Традиционные масштабируемые сетевые системы хранения данных также нашли свое место в работе Центра, но ощущается острая нехватка производительности и вместимости оборудования для создания данных и обеспечения доступа к ним. Поэтому Центру потребовалось более гибкое решение, чем NAS. Например, планируется подключение процессора Dragen Bio-IT от Edico -технологии анализа генома, основанной на FPGA. Новое хранилище объемом 1,2 петабайта обеспечит достаточную производительность для подключения продукта от Edico, что позволит ускорить и упростить процесс передачи данных.

В конечном итоге все нововведения избавили Центр от необходимости использования дорогих SSD дисков, а у специалистов появилась реальная возможность попытаться завершить весь процесс секвенирования генома в 26 часов. Это труднодостижимая цель, но теперь это теоретически возможно.

Укрощение потока
Screen-Shot-2012-10-17-at-4.41.21-PM-618x316[1]

Время — решающий фактор в ходе анализа генома новорожденных с врожденными болезнями. В таких случаях каждый час имеет значение. Не менее важен временной фактор и для ситуаций, когда болезнь запущена, как в вышеописанном случае с двумя сестрами.

ДНК человека содержит более 3,1 миллиарда пар оснований, создающих более 22 000 генов, кодирующих более чем 100 000 белков. Очевидно, что работа с этими данными требует высокой производительности оборудования. Поэтому Центру приходится прилагать значительные усилия для того чтобы соответствовать всем требованиям и эффективно обрабатывать этот потрясающий поток данных. Для этого необходимо убрать все узкие места и обеспечить достаточную производительность, а самое главное — эффективную масштабируемость хранилищ данных. В их случае, DDN хранилища вместе с масштабируемым и высокопроизводительным решением для управления данными и файлами IBM Spectrum Scale способны решить эту проблему.

Хотя проблемы центра обусловлены спецификой работы с геномом человека, сложности, с которыми он сталкивается при работе с данными, имеют огромное значение для всего научного сообщества. Использование самых прогрессивных технологий требует значительных инвестиций, но они позволят укротить поток данных и принимать взвешенные эффективные решения.

ОСТАВЬТЕ ОТВЕТ