Métricas de Gestão de Serviços — Engenharia de Confiabilidade
“No mundo do gerenciamento de serviços de TI, duas métricas importantes usadas para medir o desempenho e a eficiência de um serviço são MTTR (Mean Time To Recover) e MTTD (Mean Time To Detect). Essas métricas são críticas para melhorar a qualidade do serviço que as equipes de TI fornecem aos seus clientes. Nesta postagem do blog, forneceremos uma visão geral abrangente de MTTR e MTTD e explicaremos por que eles são importantes para o gerenciamento de serviços de TI.”
Artigo de Abhishek Gupta — https://lnkd.in/d2e5BWe9
Os conceitos “SLO e SLI” vieram da engenharia do Google, conhecer estes parâmetros é importante para que as variações de serviço sejam observadas e conformes nos ambientes de Cloud para os times de serviço, GRC e SREs.
Descendo nos conceitos da Engenharia de Confiabilidade:
Mas o que é disponibilidade?
A “disponibilidade” de um dispositivo é matematicamente dada por MTBF / (MTBF + MTTR) para o horário de trabalho agendado.
O ciclo expandido (ISO9001):
MTTR — Mantenabilidade
O tempo médio de reparo (MTTR) é uma medida da capacidade de manutenção de um item reparável, que informa o tempo médio necessário para reparar um item ou componente específico e retorná-lo ao status normal de trabalho.
MTTR = (Tempo total de reparo) / (quantidade de falhas)
MTBF — Disponibilidade
O tempo médio entre falhas (MTBF) refere-se à quantidade média de tempo que um dispositivo ou produto funciona antes de falhar. Como calcular:
MTBF = (Tempo total disponível — Tempo perdido) / (Número de paradas)
MTBSI — Confiabilidade
O relatório MTBSI calcula a média do tempo de atividade e inatividade entre falhas de componentes do modelo de serviço de acordo com a seguinte fórmula:
MTBSI = (uptime + downtime) / número de incidentes de serviço (todos os valores durante um único período de resumo)
“Um cronograma de produção que inclua tempo de inatividade para manutenção preventiva pode prever com precisão a produção total. As programações que ignoram o tempo médio entre falhas e o tempo médio de reparo são simplesmente desastres futuros que aguardam correção.”
Fonte: FM2s — https://lnkd.in/dkh
Fonte: TPS — Sistema Toyota de Produção
Fonte: LEAN Enterprise e LEAN Manufacturing (por mais que digam que só exista um LEAN, acho importante o desmenbramento para situações específicas de fluxo de valor)