|
Tópicos sobre a implantação do processo de descoberta de conhecimento em organizações empresariais |
|
Autores: Carlos Miguel Tobar e Maria de Fátima Messi |
|
Resumo A informação tem sido, cada vez mais, um fator relevante para os tomadores de decisões em uma organização. A busca desenfreada pela informação e sua importância levam a procurar meios eficazes de obtê-la, bem como métodos para tratá-la e extraí-la a partir de bancos de dados. Mineração de Dados é uma tecnologia que surgiu com o intuito de auxiliar na constante busca pela informação, agindo sobre armazéns com grandes quantidades de dados e tentando extrair destes apenas a informação que é relevante à organização. O objetivo deste trabalho é abordar tópicos para a implantação de um processo de descoberta de conhecimento, utilizando uma ferramenta de Mineração de Dados, visando o auxílio à tomada de decisões em uma organização empresarial. Atualmente, muitos dos sistemas em produção nas organizações possuem saídas de informações que não satisfazem os tomadores de decisões, sendo gasto muito tempo para manipular dados até que informações sejam apresentadas na forma desejada. Com a utilização de uma ferramenta de Mineração de Dados, espera-se que estas respostas auxiliares nas tomadas de decisões possam ser obtidas em menor tempo e com menos esforço. Palavras-chave: Mineração de Dados; Descoberta de Conhecimento; Tecnologia da Informação; Plano de Implantação; Sistema de Informação. 1. Introdução Desde a década de 60, os bancos de dados e a tecnologia da informação têm evoluído de sistemas de processamento de arquivos primitivos a sofisticados e poderosos sistemas de bancos de dados. Métodos eficientes para processamento de transações OLTP (On line Analytical Processing), onde uma consulta é visualizada como uma transação somente para leitura, têm contribuído substancialmente para a evolução e a aceitação da tecnologia relacional como a melhor ferramenta para armazenagem eficiente, recuperação e manipulação de grandes quantidades de dados [HAN, 2001]. A tecnologia de banco de dados, desde meados dos anos 80, tem sido caracterizada pela adoção popular do modelo relacional e por um aumento nas pesquisas sobre novos bancos de dados mais poderosos. Estas pesquisas abrangem bancos de dados relacionais-estendidos, orientados a objetos, objeto-relacionais e modelos dedutivos. Sistemas de bancos de dados heterogêneos e sistemas de informação baseados em Internet também têm se mostrado bastante importantes para as organizações. Atualmente, os dados podem ser armazenados em diferentes tipos de bancos de dados, porém a abundância de dados aliada à necessidade de ferramentas poderosas de análise de dados têm sido um problema para as organizações. Os dados coletados em grandes bancos de dados têm se tornado arquivos não utilizados e, com isso, importantes decisões são freqüentemente tomadas baseando-se, não na informação armazenada, e sim na intuição do tomador de decisão, simplesmente porque ele não dispõe da ferramenta apropriada para efetuar a extração da informação de maneira segura. A principal razão pela qual a Mineração de Dados tem ganhado mercado é devido à existência de grande quantidade de dados e a iminente necessidade de transformar tais dados em informação útil e conhecimento. A Mineração de Dados pode ser vista como um resultado da evolução natural da tecnologia da informação [HAN, 2001]. A idéia essencial da Mineração de Dados é a extração de relacionamentos de dados a partir de um banco de dados com grande quantidade de dados armazenados. As ferramentas de Mineração de Dados são utilizadas para prever tendências e comportamentos futuros, permitindo aos tomadores de decisões basearem-se em fatos passados e não em suposições. Embora a Mineração de Dados seja uma tecnologia poderosa na descoberta de informações ocultas nos bancos de dados, ela não elimina a necessidade de conhecimento do negócio e o entendimento dos dados. Além disso, requer o entendimento da ferramenta escolhida, bem como do algoritmo utilizado na busca dos dados [FAYYAD e UTHURUSAMY, 1996]. A Mineração de Dados é uma das etapas do processo de descoberta do conhecimento (KDD Knowledge Discovery in Database), buscando por padrões de interesse e utilizando-se de uma forma particular de representação ou de um conjunto de tais representações. No item 3, são detalhadas as etapas deste processo, seguindo as definições do modelo CRISP (Cross Industry Standard Process for Data Mining) [CRISP, 1999], cujo objetivo central é auxiliar na descoberta do conhecimento nas organizações. Este trabalho tem como objetivo central abordar tópicos para um plano de implantação do processo de descoberta do conhecimento para empresas, utilizando uma ferramenta de Mineração de Dados junto a sistemas implantados e que produzem grande quantidade de dados. A seguir, é apresentado um arcabouço para um plano de implantação da Mineração de Dados em uma organização com sistemas em operação, com vistas à implantação de um processo de descoberta do conhecimento, que se inicia com a escolha de uma ferramenta. Uma síntese dos critérios dessa escolha é apresentada primeiro, baseando-se na metodologia de Collier [COLLIER et al., 1999] que define a forma pela qual tais critérios são pontuados e analisados. O item seguinte apresenta as etapas pertencentes ao processo de descoberta do conhecimento seguindo o modelo CRISP [CRISP, 1999]. O trabalho é finalizado apresentando conclusões, de forma que possam ser utilizadas de maneira prática por organizações empresariais que estejam interessadas em um processo de descoberta do conhecimento. 2. Critérios para Escolha de uma Ferramenta Para que a escolha de uma ferramenta de Mineração de Dados seja executada com sucesso, alguns critérios devem ser considerados, levando-se em conta os objetivos da organização e, desta forma, permitir minimizar ou até mesmo eliminar os impactos negativos da escolha de uma ferramenta inadequada para um determinado objetivo [MESSI, 2001]. A metodologia de Collier é um instrumento a ser utilizado na seleção de uma entre várias ferramentas e vem definir categorias de critérios a serem considerados durante a avaliação, que são apresentadas a seguir:
|
|||||||