IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Новость 13.12.2023

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Подробнее по ссылке.

обсудить сотрудничество

хочу стать клиентом хочу работать у вас хочу стать партнером

Я даю согласие на обработку персональных данных в целях потенциального партнерства. С Политикой обработки персональных данных можно ознакомиться здесь.

Я даю согласие ООО «ИТ1» и компаниям на направление мне маркетинговых материалов и коммерческих предложений. Проставляя галочку, я также даю согласие на обработку персональных данных в указанных целях.

Возврат к списку

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Рекомендуем

IT_One Java Meetup «Джедайские трюки Java, или Как оптимизировать приложения»

Практика проектных метрик в разработке программного обеспечения

Ирина Сокольская, IT_ONE: Секрет успеха — баланс hard и soft skills ИТ-специалистов

Ирина Сокольская, IT_ONE: Секрет успеха — баланс hard и soft skills ИТ-специалистов

Ирина Сокольская, IT_ONE: Секрет успеха — баланс hard и soft skills ИТ-специалистов

обсудить сотрудничество

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Рекомендуем

IT_One Java Meetup «Джедайские трюки Java, или Как оптимизировать приложения»

Практика проектных метрик в разработке программного обеспечения

Ирина Сокольская, IT_ONE: Секрет успеха — баланс hard и soft skills ИТ-специалистов

Ирина Сокольская, IT_ONE: Секрет успеха — баланс hard и soft skills ИТ-специалистов

Ирина Сокольская, IT_ONE: Секрет успеха — баланс hard и soft skills ИТ-специалистов

обсудить сотрудничество

обсудить сотрудничество

Заказать услугу

Согласие

Заявка на сотрудничество отправлена!