|
Implementação da Gestão Operacional
de Pequena e Média Plataformas com Eficiência e Baixo Custo
Autor: Flávio Luis de Oliveira,
Hélio Hamilton Sartorato, e Yuri Damasceno Schultz
O desenvolvimento de ferramentas e metodologia próprias
para gestão de ambiente operacional como alternativa à aquisição
de soluções já existentes no mercado é um
caminho para resolver problemas operacionais que alia customização
e confiabilidade a baixo custo em serviços de informática
pública.
1. Introdução
O objetivo deste trabalho é apresentar um estudo de caso sobre
a experiência da implementação de monitoramento e
gestão do ambiente operacional na Companhia de Informática
do Paraná, através do remanejamento e melhoria de estrutura
já existente, tendo como focos principais a ótima qualidade
de serviços e o baixo custo.
2. A Celepar
A Companhia de Informática do Paraná - CELEPAR é
uma sociedade de economia mista, criada em novembro de 1964, sendo a primeira
empresa de informática pública do país. Atua no desenvolvimento
de sistemas e soluções corporativas e de tecnologia da informação
específicas para cada área do governo, integrando o Governo
do Estado do Paraná no parque corporativo de informática,
com 160 servidores hospedando sistemas que dão acesso a bancos
de dados com informações do Estado e de serviços
prestados ao cidadão.
2.1. O Datacenter
A Divisão de Operações é o setor responsável
por manter o Datacenter da Celepar em regime de operação
24x365 (24 horas por dia, 365 dias por ano). No início do ano de
2001, o Datacenter era composto por 40 servidores e um Mainframe Fujitsu.
O ambiente cresceu rapidamente e hoje, além do Mainframe Fujitsu
e um IBM em fase de instalação, conta com 160 servidores
em diferentes arquiteturas com sistemas operacionais Windows2000, NT,
Solaris, HP-UX, IBM-AIX, FreeBSD e diversas distribuições
de Linux. Associada a esta estrutura está uma solução
de armazenamento da EMC2 com capacidade de 2TB, onde são mantidas
as principais bases de dados corporativas do Estado do Paraná.
Completa este ambiente um pool de impressoras com capacidade de 17.500
páginas por hora.
Os equipamentos são hospedados em ambiente com temperatura controlada
e portas de segurança. A continuidade das operações
é garantida por um sistema de no-break formado por um banco de
baterias capazes de suprir energia por, pelo menos, 30 minutos ao Datacenter,
as quais são alimentadas por um gerador a diesel, podendo manter
os equipamentos operacionais, na ausência da rede elétrica,
o tempo que for necessário.
3. O Grupo GOPMP
A fim de implementar soluções de monitoramento centralizado
dos servidores e aplicações, surgiu, em março de
2003, o grupo GOPMP ou Gestão Operacional de Pequena e Média
Plataforma. O grupo foi criado a partir de recursos humanos da Divisão
de Operações sob a coordenação de um analista
de informática, e tem os seguintes objetivos:
- Manter uma base de dados de informações sobre os equipamentos
instalados, visando um rápido atendimento das ocorrências
e a conseqüente diminuição do tempo de indisponibilidade;
- Desenvolver e implementar ferramentas de monitoramento e gestão
para todas as plataformas envolvidas;
- Desenvolver e implementar normas para execução de procedimentos
operacionais nas plataformas envolvidas.
4. Desenvolvendo Ferramentas Próprias
A utilização de ferramentas de software próprias
e customizadas permite uma maior aproximação das necessidades
do ambiente, além de não possuir custos de aquisição
e manutenção.
O início dos trabalhos no monitoramento do ambiente operacional
foi através da utilização de ferramentas freeware
e shareware disponíveis no mercado. Durante a utilização
foi possível verificar que as ferramentas analisadas, apesar de
possuírem uma funcionalidade adequada para o uso em monitoramento
de servidores, geralmente não possibilitavam uma maior customização
para atender à demanda do ambiente. Esta necessidade justificou
o início do desenvolvimento do CelDisp (Celepar Disponibilidade
de Servidores e Serviços). Em três meses estava pronta a
primeira versão. Atendendo todas as expectativas dos operadores
com relação ao teste de portas lógicas e de páginas
web pré-defindas, analisando o conteúdo de retorno, além
de permitir ajustes nos intervalos de timeout e repetição
dos testes, o CelDisp tornou-se a ferramenta oficial de monitoramento,
conforme Figura 1.

O CelDisp opera de forma descentralizada, gravando seus dados no banco
de dados do GOPMP, permitindo a utilização destas informações
por outros aplicativos, entre eles o CelConsole, uma página web
dinâmica atualizada a cada dez segundos, trazendo do banco de dados
as informações de disponibilidade dos servidores, conforme
Figura 2. Isto permite uma rápida ação dos técnicos
da Divisão de Operações em caso de falhas, e possibilita
monitorar a disponibilidade do ambiente fora do Datacenter através
do browser, proporcionando, por exemplo, uma visão de negócio
por parte da gerência e diretoria.

Como o CelDisp e o CelConsole tiveram grande impacto na redução
do tempo de atendimento aos serviços faltosos, o próximo
passo seria a criação de uma ferramenta que permitisse antever
o surgimento dos problemas, possibilitando a sua prevenção.
Teve início então o desenvolvimento do CelMonitor (Celepar
Monitoramento de Performance), ferramenta composta de um servidor centralizador
de informações e agentes instalados nos servidores, responsáveis
por obter informações de utilização de processador,
memória, discos rígidos e outros dispositivos. Atualmente
o agente atende apenas o ambiente Windows, e o desenvolvimento para outras
plataformas será iniciado em breve. Através dos relatórios
do CelMonitor é possível detectar melhor os “picos”
e os “vales” no processamento dos serviços e fornecer
subsídios para outros setores atuarem em melhoria de equipamentos
ou reaproveitamento de recursos pouco utilizados. Assim como o CelDisp,
o CelMonitor também é descentralizado e armazena informações
no banco de dados do GOPMP, permitindo que suas análises de hardware
estejam da mesma forma disponíveis no CelConsole.
Outro problema enfrentado pela equipe do ambiente operacional era o telefone.
No momento em que caíam serviços, os técnicos da
operação tinham de dividir-se em prestar o suporte para
o reestabelecimento dos sistemas e o suprimento de informações
para a Central de Atendimento ao Cliente (CAC), muitas vezes passando
e recebendo informações truncadas, pela própria deficiência
do meio telefônico. Para minimizar o problema e agilizar o contato
e a passagem de informação para os analistas do suporte
de segundo nível, foi desenvolvida uma ferramenta de console de
mensagens chamada CelMessage (Celepar Serviço de Mensagens Urgentes),
já disponível nas estações de trabalho dos
técnicos do ambiente operacional, Central de Atendimento a Clientes
e analistas da Gerência de Tecnologia da Informação,
bem como chefes e gerentes envolvidos. O CelMessage possibilita uma comunicação
global rápida e eficiente, trazendo informação atualizada,
clara e disponível para todos os usuários, conforme Figura
3. As mensagens do CelMessage ficam registradas no banco de dados do GOPMP,
permitindo uma consulta das ocorrências do ambiente através
do acesso ao portal de monitoramento.

Para consolidar os serviços oferecidos pelo GOPMP e servir como
um concentrador de informações do Datacenter Celepar, foi
desenvolvido e está sendo aprimorado um Portal de Monitoramento
que, além do CelConsole e do CelMonitor, presta diversos serviços
referentes aos servidores, como geração de relatórios
e gráficos do monitoramento de performance, realização
de buscas e cadastramento de informações, impressão
de etiquetas de identificação, acesso ao histórico
de mensagens do CelMessage e inclusão de documentos digitais referentes
aos servidores, entre outras tarefas integradas pelo banco de dados do
GOPMP. Este Portal, mostrado na Figura 4, está sendo desenvolvido
em ambiente de software livre, atendendo a atual meta do Governo do Estado
do Paraná.

5. A Importância de um Cadastro Fiel de Servidores e Serviços
Nenhuma das ferramentas desenvolvidas tem sentido se não for
mantida uma base de dados confiável sobre os servidores e serviços
instalados no Datacenter. Por isso, a constante atualização
das informações do cadastro de servidores integrado com
o banco de dados do GOPMP é vital para o funcionamento dos aplicativos.
Se, por exemplo, altera-se um endereço IP em um servidor e esta
alteração não é executada no cadastro do servidor,
as ferramentas de performance e disponibilidade atuantes naquele servidor
deixarão de atuar ou reportarão informações
errôneas. Para minimizar estes problemas e seguindo as implementações
existentes em ferramentas de monitoramento de uso comercial, está
previsto para o futuro o desenvolvimento do CelInvent, também integrado
com o banco GOPMP que fornecerá e manterá atualizadas informações
sobre o inventário dos servidores, detectando inclusive alterações
em hardware ou software. É claro que esta ferramenta não
poderá monitorar dados igualmente importantes mas que devem ser
entrados manualmente, como números de telefone ou nome do contato
no cliente, que também compõem cadastro de servidores.
6. Normatização de Procedimentos
A criação de procedimentos normatizados para o Datacenter
é a garantia de que a execução das diferentes tarefas
será feita sempre da mesma forma e com qualidade nos quatro diferentes
turnos de operação. Estas normas devem atender todas as
possibilidades, desde tarefas simples como o check list de todos os passos
na entrada e saída de servidores no ambiente, até a forma
de interação com a CAC e acionamento do suporte de segundo
nível, no caso de ocorrências não solucionadas pela
Divisão de Operações. A criação de
cada procedimento traz consigo amplos e “acalorados” debates
entre as áreas envolvidas, mas também oferece a oportunidade
de eliminar pontos de falha em tarefas rotineiras que não evoluíram
seus procedimentos com o tempo. Para facilitar sua execução
e compreensão, alguns procedimentos são criados na forma
de fluxogramas, com as etapas do processo envolvido, conforme apresentado
na Figura 5.

7. Resultados Obtidos e Planos para o Futuro
Mesmo com o pouco tempo de existência do grupo GOPMP e das ferramentas
desenvolvidas, foi possível verificar uma melhora significativa
nas estatísticas de disponibilidade dos servidores e serviços,
obtendo-se como resultado, para o mês de agosto de 2003, por exemplo,
uma disponibilidade média do ambiente da ordem de 99,73%, como
mostra a Figura 6.

Muito existe ainda para ser feito, e dentre as metas para o futuro no
monitoramento do ambiente operacional estão, além dos já
citados, o monitoramento de serviços em ambiente Mainframe, o monitoramento
de sites remotos, permitindo a atuação das ferramentas de
monitoramento em ambientes fora do Datacenter Celepar e integração
das ferramentas existentes com sistemas antivírus, IDS e firewall.
8. Referências
1. HOSPEDAGEM de servidores PROCERGS. Disponível em: <http://www.hsp.procergs.com.br>.
Acesso em: mar. 2003.
2. MSDN. Disponível em: <http://jakarta.apache.org>.
Acesso em: mar. 2003.
3. THE APACHE jakarta project. Disponível em:
<http://jakarta.apache.org>.
Acesso em: mar. 2003.
4. THE SOURCE for java technology. Disponível em:
<http://javasoft.com/>. Acesso
em: mar. 2003.
flavio@pr.gov.br
helio@pr.gov.br
schultz@pr.gov.br

|