Glossário IA
O dicionário completo da Inteligência Artificial
Model Versioning
Sistema de gestão de versões de modelos de machine learning que permite acompanhar as iterações, comparar o desempenho e reverter a versões anteriores em caso de regressão.
Data Version Control (DVC)
Ferramenta de código aberto que estende o Git para gerenciar o versionamento de datasets e modelos volumosos, armazenando os metadados no Git e os arquivos binários em storages de nuvem.
Git LFS
Git Large File Storage, extensão do Git que permite versionar arquivos grandes como datasets e modelos, armazenando-os separadamente do repositório Git principal.
Experiment Tracking
Processo sistemático de registro de hiperparâmetros, métricas, artefatos e resultados de experimentos de ML para garantir a rastreabilidade e a reprodutibilidade.
Model Registry
Sistema centralizado de armazenamento e gestão das versões de modelos de ML com seus metadados, status de implantação e histórico de desempenho.
Reproducibility
Capacidade de recriar exatamente os mesmos resultados de um experimento de ML usando os mesmos dados, código, parâmetros e ambiente de execução.
Artifact Repository
Sistema de armazenamento versionado para artefatos de ML, incluindo modelos treinados, datasets pré-processados e outros arquivos binários com gestão de metadados.
Model Drift Detection
Processo de monitoramento contínuo do desempenho e das distribuições de dados para identificar a degradação dos modelos devido a mudanças nos padrões de dados.
Integração Contínua para ML (CI/ML)
Automatização dos testes de validação de código, dados e modelos a cada commit para garantir a qualidade e a consistência no pipeline ML.
Treinamento Contínuo
Automatização do retreinamento periódico dos modelos com novos dados para manter sua relevância diante da evolução dos padrões de dados.
Monitoramento de Modelo
Monitoramento contínuo em produção das previsões, desempenhos e distribuições de entrada para detectar anomalias e garantir o bom funcionamento dos modelos.
Proveniência de Dados
Documentação completa da origem, histórico e transformações dos dados utilizados nos pipelines ML, essencial para auditoria e conformidade.
Versionamento Semântico
Convenção de numeração (X.Y.Z) para as versões de modelos onde X indica mudanças maiores, Y adições de funcionalidades, e Z correções menores.
Arquitetura Lakehouse
Arquitetura híbrida combinando a flexibilidade dos data lakes com a gestão estruturada dos data warehouses para otimizar o versionamento e análise de dados ML.
Linha de Base do Modelo
Modelo de referência ou versão inicial usada como ponto de comparação para avaliar melhorias ou detectar regressões nas novas versões.