Autor:
Carlos Alberto Sowek
Em um artigo que fala
sobre data warehousing são discutidas 5 idéias fundamentais para
se ter sucesso com Data Warehouse:
- Aplicativos Operacionais
X Suporte a Decisão
- Dados Primitivos
X Derivados
- Dados Históricos
- Administração de
Dados
- Arquitetura do Sistema
Destas 5 idéias achamos
importante ressaltar a que se refere à Administração de Dados,
que é algo visto com pouca importância e às vezes deixada de lado,
e que deve ser melhor avaliada pelas organizações, pois a existência
dela torna-se fundamental na construção de um Data Warehouse.
ADMINISTRAÇÃO
DE DADOS
Um obstáculo na utilização
de administração de informações é a utilização e a qualidade da
informação das aplicações existentes. A maioria das aplicações
existentes são desenhadas para um propósito operacional específico,
e administra os dados somente para este propósito. Diferentes
aplicações, desenvolvidas em diferentes tempos, para diferentes
propósitos operacionais, muitas vezes contêm dados que são inconsistentes
ou redundantes com dados em outras aplicações. Elementos de dados
com o mesmo nome podem ser definidos diferentemente. O mesmo elemento
em dois sistemas diferentes pode ser armazenado com nomes diferentes.
Em casos piores; múltiplos elementos de dados são, algumas vezes,
embutidos no mesmo campo.
Ainda que o valor do
dado nas empresas modernas seja bem documentado, a necessidade
de administrar os dados da corporação não é geralmente reconhecida.
Em recentes artigos
encontramos os seguintes comentários:
- Muitos administradores
não percebem a qualidade do dado que eles usam. Qualidade ruim
parece ser normal, mais do que uma exceção, e eles têm largamente
ignorado o uso da qualidade;
- Qualidade ruim do
dado pode causar imediatamente danos econômicos e tem outros
indiretos e sutis efeitos;
Administração de Dados
é o meio para administrar a qualidade dos dados corporativos.
Isto envolve especificar responsabilidades específicas:
- Identificar e administrar
"data proponency": Um "data proponent" é
a pessoa que é responsável pela qualidade de uma coleção de
elementos de dados conhecidos.. Usualmente o "data proponent"
é um membro chave do staff no grupo de responsáveis pelos processos
da organização onde o dado é originado. Por exemplo; o analista
chave de recursos humanos pode ser o "data proponent"
para o dado empregado. Se existe um problema com qualidade do
dado empregado, o analista de recursos humanos deverá ser a
pessoa que encontre o problema e corrija-o. Para cada elemento
de dado, administradores de dados identificam de onde o elemento
é originado e qual é o "data proponent".
- Estabelecer padrões
de administração de dados, políticas e procedimentos: Administradores
de Dados estabelecem as diretrizes para gerenciar os recursos
dos dados corporativos. Estas diretrizes incluem padrões para
definir elementos de dados, modelagem de dados e política para
particionar dados com diferentes grupos dentro e fora da organização.
Estas responsabilidades, incluem estabelecimento de padrões
para definição e uso do dado, coordenação e aprovação de modelo
de dados, participando no esforço de correção do dado, desenvolvimento
de medidas para qualidade dos dados e melhoria dos processos
que geram consistentemente qualidade ruim dos dados.
- Coordenar e aprovar
modelo de dados: Administradores de dados revisam modelos de
dados criados na análise do negócio e desenvolvimento de sistemas
para assegurar que o modelo esteja em conformidade com padrões
de administração de dados, políticas e procedimentos. Como parte
da revisão do modelo de dados, os administradores de dados asseguram
que cada elemento de dado está apropriadamente definido. Uma
lista parcial dos itens requeridos para definir alguns elementos
de dados deverá incluir uma concisa e precisa descrição verbal.
O domínio do elemento (intervalo dos valores possíveis válidos),
e a fonte do elemento (que sistema é entrada para, ou de qual
provedor externo).
Isto é muito importante
para distinguir Administradores de Dados (AD) de administradores
de banco de dados. Administradores de dados são orientados a negócio,
focando nos meios e uso do dado. Administradores de Banco de Dados
(DBA´s) são tecnicamente orientados, e estão preocupados com a
confiabilidade, integridade e performance das aplicações de banco
de dados. Enquanto o DBA tipicamente corrige erros das aplicações
para resolver problemas de processamento do banco de dados, um
AD tipicamente trata com problemas do negócio, verifica valores
de dados incorretos ou uso inválido dos dados ou mal interpretação
dos mesmos.
Um Data Warehouse é
um sistema para administradores de dados. Data Warehouse provém
um sistema que administradores de dados podem usar para administrar
e melhorar os dados. A menos que seja guiado pelos princípios
e técnicas de administração de dados, o data warehouse não deverá
ser uma fonte de informações verdadeiras.
Parte do esforço para
obter sucesso em data warehousing é um programa de treinamento
em administração de dados, assegurando que todos os participantes
entendam e suportem os objetivos da qualidade dos dados, e que
a administração deve assinalar os "data proponent" e
deve ir fundo para ressaltar melhor a qualidade dos dados nas
aplicações.
A intenção com este
artigo não é de definir as tarefas nem de estabelecer quem deve
fazê-las e que maneira, pois cada organização tem seus critérios
e suas políticas para implementá-las. O que colocamos é um alerta
no sentido de que existe a necessidade de que os papeis de AD
existam e sejam exercidos efetivamente dentro da organização e
dentro de certos princípios de qualidade, pois de nada serve ter
respostas rápidas e de formato agradável se a pessoa que toma
decisões não confia nos dados ou não sabe qual a fonte dos mesmos.
Como o termo AD está
um pouco em desuso, algumas organizações fazem o uso do termo
ARI (Administração de Recursos para Informação) que abrange não
só o aspecto do dado como da tecnologia do dado, isto é, preocupa
se em prover maneiras eficientes de gerenciar, acessar, manipular
e distribuir os dados existentes nos vários ambientes/plataformas
da organização.
REFERÊNCIA BIBLIOGRÁFICA
LAMBERT, Bod. Data
Warehousing fundamentals: What you Need to Succeed. Disponível
na Internet. http://www.data-wareh...ce/articles/lamb8.htm.
30 nov. 1996
sowek@celepar.gov.br
