Глоссарий ИИ
Полный словарь искусственного интеллекта
Хранилище данных
Централизованное хранилище данных, оптимизированное для анализа и принятия решений, собирающее операционные и исторические данные из множества источников. Разработано для поддержки сложных аналитических запросов на больших объемах структурированных данных.
Витрина данных
Подмножество хранилища данных, сфокусированное на конкретной бизнес-области или отделе. Облегчает доступ к релевантным данным для целевого анализа, одновременно снижая сложность запросов.
ETL (Извлечение, Преобразование, Загрузка)
Процесс интеграции данных, извлекающий информацию из разнородных источников, преобразующий ее согласно бизнес-правилам, а затем загружающий в хранилище данных. Гарантирует качество и согласованность данных перед их анализом.
ELT (Извлечение, Загрузка, Преобразование)
Современный подход к интеграции, при котором необработанные данные сначала загружаются в целевую систему, а затем преобразуются на месте. Оптимизирует производительность на облачных платформах и распределенных архитектурах.
OLAP (Оперативная аналитическая обработка)
Технология многомерного анализа, позволяющая выполнять сложные запросы на больших объемах исторических данных. Поддерживает операции детализации, агрегации, среза и нарезки для исследования данных.
OLTP (Оперативная обработка транзакций)
Система управления транзакциями в реальном времени, оптимизированная для операций CRUD (Создание, Чтение, Обновление, Удаление). Разработана для обработки большого количества коротких атомарных транзакций с высокой конкурентностью.
Звездообразная схема
Моделирование данных для хранилища данных с центральной таблицей фактов, окруженной денормализованными таблицами измерений. Оптимизирует производительность аналитических запросов за счет минимизации соединений.
Снежинкообразная схема
Вариант звездообразной схемы, где таблицы измерений нормализованы в иерархии из нескольких таблиц. Уменьшает избыточность данных, но увеличивает сложность аналитических запросов.
Таблица фактов
Центральная таблица размерной схемы, содержащая числовые показатели и внешние ключи к измерениям. Хранит количественные бизнес-факты, такие как продажи, транзакции или показатели эффективности.
Таблица измерений
Таблица, описывающая контекст показателей в таблице фактов, содержащая качественные описательные атрибуты. Позволяет анализировать данные по различным осям, таким как время, география или продукты.
Data Vault
Гибридная методология моделирования, сочетающая преимущества 3NF и звездообразной схемы для масштабируемых хранилищ данных. Разделяет хабы, связи и спутники для обеспечения аудируемости и масштабируемости.
Колоночная база данных
База данных, хранящая данные по столбцам, а не по строкам, оптимизирующая аналитические запросы по подмножествам столбцов. Значительно сокращает время отклика и место для хранения для рабочих нагрузок BI.
База данных в оперативной памяти
Система базы данных, хранящая данные преимущественно в оперативной памяти для почти мгновенного доступа. Резко ускоряет сложный анализ и интерактивные отчеты по данным хранилища.
Распределенная обработка запросов
Техника выполнения запросов на нескольких вычислительных узлах параллельно для обработки больших объемов данных. Разделяет обработку на распределенные задачи для оптимизации использования ресурсов и сокращения времени отклика.
Федерация данных
Подход виртуальной интеграции, представляющий унифицированное представление данных из гетерогенных источников без физического дублирования. Позволяет проводить анализ в реальном времени в распределенных системах, сохраняя исходные данные.
Агрегатная таблица
Предварительно рассчитанная таблица, содержащая сводные данные на разных уровнях детализации для ускорения повторяющихся запросов. Ключевая стратегия оптимизации для производительности отчетов BI на больших объемах.
Медленно меняющееся измерение (SCD)
Техника управления изменениями в таблицах измерений для отслеживания исторической эволюции атрибутов. Реализует различные стратегии (Тип 1, 2, 3) в зависимости от потребностей временной трассировки данных.
Пайплайн данных
Цепочка автоматизированных процессов, захватывающих, преобразующих и доставляющих данные от источника до конечного пункта назначения. Оркестрирует непрерывный поток данных для питания аналитических систем и BI-приложений.