Versionamento de modelos e dados

📖

termos

Model Versioning

Sistema de gestão de versões de modelos de machine learning que permite acompanhar as iterações, comparar o desempenho e reverter a versões anteriores em caso de regressão.

📖

termos

Data Version Control (DVC)

Ferramenta de código aberto que estende o Git para gerenciar o versionamento de datasets e modelos volumosos, armazenando os metadados no Git e os arquivos binários em storages de nuvem.

📖

termos

Git LFS

Git Large File Storage, extensão do Git que permite versionar arquivos grandes como datasets e modelos, armazenando-os separadamente do repositório Git principal.

📖

termos

Experiment Tracking

Processo sistemático de registro de hiperparâmetros, métricas, artefatos e resultados de experimentos de ML para garantir a rastreabilidade e a reprodutibilidade.

📖

termos

Model Registry

Sistema centralizado de armazenamento e gestão das versões de modelos de ML com seus metadados, status de implantação e histórico de desempenho.

📖

termos

Reproducibility

Capacidade de recriar exatamente os mesmos resultados de um experimento de ML usando os mesmos dados, código, parâmetros e ambiente de execução.

📖

termos

Artifact Repository

Sistema de armazenamento versionado para artefatos de ML, incluindo modelos treinados, datasets pré-processados e outros arquivos binários com gestão de metadados.

📖

termos

Model Drift Detection

Processo de monitoramento contínuo do desempenho e das distribuições de dados para identificar a degradação dos modelos devido a mudanças nos padrões de dados.

📖

termos

Integração Contínua para ML (CI/ML)

Automatização dos testes de validação de código, dados e modelos a cada commit para garantir a qualidade e a consistência no pipeline ML.

📖

termos

Treinamento Contínuo

Automatização do retreinamento periódico dos modelos com novos dados para manter sua relevância diante da evolução dos padrões de dados.

📖

termos

Monitoramento de Modelo

Monitoramento contínuo em produção das previsões, desempenhos e distribuições de entrada para detectar anomalias e garantir o bom funcionamento dos modelos.

📖

termos

Proveniência de Dados

Documentação completa da origem, histórico e transformações dos dados utilizados nos pipelines ML, essencial para auditoria e conformidade.

📖

termos

Versionamento Semântico

Convenção de numeração (X.Y.Z) para as versões de modelos onde X indica mudanças maiores, Y adições de funcionalidades, e Z correções menores.

📖

termos

Arquitetura Lakehouse

Arquitetura híbrida combinando a flexibilidade dos data lakes com a gestão estruturada dos data warehouses para otimizar o versionamento e análise de dados ML.

📖

termos

Linha de Base do Modelo

Modelo de referência ou versão inicial usada como ponto de comparação para avaliar melhorias ou detectar regressões nas novas versões.

Glossário IA

Model Versioning

Data Version Control (DVC)

Git LFS

Experiment Tracking

Model Registry

Reproducibility

Artifact Repository

Model Drift Detection

Integração Contínua para ML (CI/ML)

Treinamento Contínuo

Monitoramento de Modelo

Proveniência de Dados

Versionamento Semântico

Arquitetura Lakehouse

Linha de Base do Modelo

Nenhum resultado encontrado