CedrusData – это аналитическая система, которая позволяет компаниям эффективно анализировать все свои данные через единый интерфейс.
Внедрение Cedrusdata способствует достижению целей:
- Быстрое извлечение ценности из данных предприятия.
- Повышение производительности сотрудников, принимающих решения на основе данных.
- Снижение нагрузки на инженеров платформы данных и удешевление инфраструктуры.
CedrusData позволяет организациям удобно и быстро анализировать все свои данные в озерах данных, корпоративных хранилищах и операционных системах через единый интерфейс доступа, одновременно снижая расходы на аналитическую инфраструктуру за счет эластичной масштабируемости, уменьшения дупликации данных и переноса нагрузки из корпоративных хранилищ в более дешевые озера данных. CedrusData подключается к источникам данных организации и предоставляет пользователям единое логическое представление всех данных через SQL-интерфейс.
Поддерживаемые источники данных:
- Озера данных в HDFS и S3-совместимых хранилищах.
- Аналитические системы (Vertica, Greenplum, ClickHouse, Teradata, и др.).
- Транзакционные системы (Postgres, MySQL, Oracle, SQL Server и др.).
- NoSQL системы (Cassandra, MongoDB, Redis, Kafka и др.).
Наличие SQL-интерфейса позволяет пользователям подключаться к CedrusData из популярных приложений, включая BI-системы, ETL-инструменты, приложения для анализа и обработки данных (Apache Spark, Jupyter, и пр.), а так же внутренние приложения предприятия.
CedrusData это массивно-параллельная вычислительная система с SQL-интерфейсом на основе open-source проекта Trino. После получения SQL-запроса, CedrusData определяет оптимальную стратегию доступа к данным, выполняет чтение данных из источников, после чего производит финальную обработку и объединение данных в кластере. Полученный результат может быть передан непосредственно приложению или пользователю, или записан в другой источник данных.
CedrusData обеспечивает высокую производительность за счет реализации следующих подходов:
- Обработка данных происходит параллельно на одном или нескольких вычислительных серверах, обеспечивая эластичную масштабируемость в облаке и on-premise.
- CedrusData использует колоночное представление данных, которое наилучшим образом подходит для выполнения сложных аналитических запросов.
- Интеллектуальный оптимизатор запросов выбирает наиболее производительную стратегию доступа к данным, минимизируя нагрузку на источники, и одновременно уменьшая количество передаваемых по сети данных.