Яхонт-BI

 

"Яхонт-BI" – интеллектуальная программная ETL-платформа для выполнения обработки информации и формирования структурированных хранилищ данных.

Увеличение объемов ежедневно поступающей информации из внешних источников информации, необходимость применения единых средств кодирования и классификации требуют применения особых, специализированных решений – серверных ETL платформ, адаптируемых к индивидуальным потребностям заказчиков. Базы и банки данных, неструктурированные текстовые массивы – ландшафт, в котором приходится функционировать современным прикладным информационным системам. Непрерывное выполнение проектов по интеграции, объединению информации нацелено не только на организацию сквозных бизнес-процессов, но и на обеспечение единых форматов накопления, кодирования и классификации всех видов накапливаемых данных. Такое кодирование и классификация при наполнении корпоративных хранилищ являются ключевым фактором, определяющим эффективность использования ресурсов компании и оправданность новых затрат в условиях эксплуатации множества информационных систем и баз данных.

В комплексе "Яхонт-BI" Компания "НОРСИ-ТРАНС" предлагает новый, инновационный подход к построению интеграционных ETL-платформ. Варианты применения "Яхонт-BI" позволяют использовать его в основе следующих видов решений по интеллектуальной ETL-обработке данных:

Основные конструктивные особенности:

  • Специальный серверный кроссплатформенный ETL-движок, использующий все возможности современных многоядерных процессоров и многопроцессорных серверов;
  • Возможность параллельной обработки одного массива данных одновременно на различных серверах;
  • Гибкие возможности по организации структуры подключенных вычислительных мощностей (координаторы, узлы управления) для распределения задач по обработке;
  • Пользователь подключается к вычислительным ресурсам через тонкий веб-2.0 клиент, предоставляющий возможности по:
    1. интерактивному конструированию схем по сбору, очистке, нормализации и загрузке данных;
    2. формированию структуры вычислительных ресурсов, динамическому подключению дополнительных мощностей;
    3. планированию выполнения сформированных ETL-задач на подключенных вычислительных мощностях.

*Примеры внешнего вида веб-2.0 РМО при конструировании схемы обработки данных приведены на рисунках ниже:

Конструирование ETL-схемы обработки данных.

 Задание параметров обработки для операции.

Обобщенная структурная схема построения интеллектуальной программной платформы "Яхонт-BI"

sheme8_5_site

 

Основные составляющие части программного обеспечения "Яхонт-BI":

  • Узлы, выполняющих ETL-обработку данных (специальный С++ движок параллельной обработки данных с полным использованием возможностей многоядерных процессоров и управляющая часть);
  • Координаторы, на которых регистрируются узлы выполнения обработки (выполняют распределение направленных координатору задач по очистке данных на подключенные узлы, на которых запускаются соответствующие движки), интерфейс подключения и работы с координатором – HTTP REST;
  • Узлы управления: выполняют накопление создаваемых оператором схем по ETL-очистке данных и хранят информацию о подключенных к ним координаторах, пользователях и т.д., обеспечивают работу веб-2.0 РМО пользователей;
  • Веб-2.0 РМО пользователей, посредством которых создаются схемы по очистке данных, нормализации и т.д., созданные и сохраненные схемы обработки оператор отправляет на выполнение на выбранные координаторы, указав при этом, на каких подключенных к каждому координатору узлах должна выполняться обработка, формирует расписание и ставит на выполнение ETL-задачи по расписанию и т.д., выполняет контроль за выполнением запущенных ETL-задач обработки, выполняет мониторинг всех вычислительных средств и программного обеспечения.

Корпоративное Интранет-облако

При построении "частных" Интранет облачных ETL-сред "Яхонт-BI" позволяет:

  • Обеспечить совместное использование ресурсов в центре обработки данных;
  • Использовать меньшее количество физического оборудования за счет 100% утилизации существующего;
  • На порядки повысить эффективность обработки данных и снизить время ETL-операций, снять нагрузку с информационных систем, каждая из которых вынуждена самостоятельно выполнять очистку и загрузку данных (как правило, на основе медленных операций СУБД);
  • Сократить издержки на закупки лицензий других ETL-инструментов для различных ИС, выполнив централизацию всех соответствующих задач средствами "Яхонт-BI".

On-Demand SaaS интернет-платформа

При построении On-Demand SaaS Интернет-платформ "Яхонт-BI" позволяет:

  • Полностью исключить затраты на закупку серверного оборудования и дорогостоящих лицензий по приобретению коробочных ETL-продуктов за счет покупки услуги по подключению к Интернет-SaaS платформе "Яхонт-BI";
  • Организациям перейти на покупку услуг по ETL-обработке данных, оплачиваемых лишь при необходимости по модели SaaS;
  • Масштабировать задействованные в обработке мощности за счет возможностей "Яхонт-BI" по функционированию на основе арендуемых виртуальных машин у PaaS-провайдеров услуг, таким образом, Заказчик оплачивает только реальные потребности по очистке, нормализации и обработке своих данных, что дает существенную экономию в течение всего срока эксплуатации собственных баз данных и информационных систем заказчика.

Интеллектуальная OSS-платформа оператора связи

При построении интеллектуальных OSS-платформ "Яхонт-BI" позволяет:

  • Решать в реальном времени (за счет массовой параллельности обрабатываемых данных на серверных вычислительных мощностях) задачи по первичному декодированию (в комплекс встроен ряд декодеров "сырых" CDR-файлов), очистке и нормализации CDR-данных;
  • Выполнять обработку полученных данных в соответствии с задаваемыми схемами преобразования, выполнять передачу информации в различные информационные системы и базы данных оператора (в т.ч. ввода их в prepaid, биллинговые системы, а также FMS-ситемы и Revenue Assuarance);
  • Обеспечивать централизованное управление и мониторинг всех потоков новой поступающей информации и ее передачи в ИС оператора, выделение ошибочного поведения коммутационного оборудования сети связи.

Персональные инструментальные решения и внедрение "под ключ"

Комплекс "Яхонт-BI" также предлагается в качестве типового "коробочного" продукта в виде инсталляционных комплектов (ОС Linux/Windows), которые можно развернуть и запустить в работу самостоятельно силами заказчика и сконфигурировать в соответствии с требующейся производительностью ETL-операций.

В целом комплекс предоставляет следующие возможности по ETL-очистке и нормализации разнородной информации:

  • Полная кроссплатформенность всех составляющих "Яхонт-BI" программных компонентов с максимальной утилизацией (загрузкой) вычислительных мощностей;
  • Десятки операций по обработке, очистке и нормализации;
  • Специальные операции по очистке данных;
  • Подключение к сетевым файловым хранилищам, серверам БД (источники, хранилища-потребители данных);
  • Кэширование справочников, используемых при обработке данных в ОЗУ, что позволяет проводить соответствующую обработку "на лету" без дополнительных обращений к БД;
  • Линейное масштабирование производительности посредством добавления вычислительных мощностей, задействованных в обработке данных;
  • Выигрыш по скорости обработки данных на несколько порядков (сотни раз) по сравнению с традиционными ETL-инструментами за счет примененных технологий in-memory обработки;
  • За счет использованных подходов взаимодействия с координатором, узлом управления (HTTP REST API) – создание специализированных подключаемых к вычислительной среде ETL-обработки данных "Яхонт-BI" внешних комплексов.

Листовка "Яхонт-BI" (pdf)