Ufsc universidade Federal de Santa Catarina ine departamento de Informática e Estatística



Baixar 41.59 Kb.
Encontro23.07.2016
Tamanho41.59 Kb.
UFSC - Universidade Federal de Santa Catarina

INE – Departamento de Informática e Estatística

Curso Bacharelado em Sistema de Informação

Florianópolis, 01 de julho de 2006.

Aluno: Herman Ignácio Ferber Pineyrua

Um Data Mart para Planos de Saúde. Uma aplicação na: FUSESC.

Orientador: Prof. Dr. José Leomar Todesco

Banca: Prof. Dr. Ronaldo dos Santos Mello

Prof. Dr. Fernando A. Ostuni Gauthier

Sr. Julio César da Rocha de Castro



1- INTRODUÇÃO
1.1 Apresentação
Os planos de saúde vêem crescendo no Brasil tanto em número de empresas quanto de associados. Isto se deve principalmente às péssimas condições em que se encontra a saúde pública em nosso país.

A Fundação Codesc de Seguridade Social (Fusesc) conta com um plano de saúde para os seus participantes e dependentes, a Caixa de Assistência - SIM. Atualmente o plano de saúde da Fusesc, doravante chamado “SIM”, possui aproximadamente 20.000 participantes (vidas). O plano tem convênio com a Unimed e outros profissionais liberais e clínicas da área da saúde de todo o estado.

O sistema de informação que opera o plano de saúde está em um ambiente transacional desenvolvido em Zim, operando desde 1996. Por ser um ambiente transacional, este sistema é carente de informações, principalmente para gestão. Além disso, este ambiente não foi projetado para apoiar as análises necessárias para o acompanhamento e gestão das atividades dos participantes no plano.

Para criar um ambiente de dados para suporte aos processos de gerência e tomada de decisão surgiu a idéia do Data Warehouse, integrando e consolidando dados em uma estrutura única para fins de exploração e análise, ampliando o conteúdo informacional.



1.2 Objetivos
1.2.1 Objetivo Geral

O objetivo deste trabalho é o de especificar, projetar e construir um Data Mart para apoiar a gestão do Plano de Saúde da Fusesc, o SIM. Para tal, será utilizada a metodologia proposta por Kimball para a construção de Data Marts, que prevê o desenvolvimento incremental usando o barramento Bus.


1.2.2 Objetivos Específicos

Pretende-se como resultado do trabalho apoiar na análise das ocorrências de forma a poder identificar a maior incidência de doenças, procedimentos falhos no plano, custo mensal do participante e obter conhecimento para apoio à implementação de ações e programas de medicina preventiva aos participantes.


1.3 Justificativas

Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na frente a organização que consegue tomar decisões corretas e rápidas, assim como os profissionais que possibilitam estes processos.

Existe uma necessidade crescente de novas ferramentas para apoiar o processo de tomada de decisão e a definição de ações, e um repositório de dados que suporte estes processos.

As técnicas OLAP (On Line Analytical Processing) aplicadas em um DW (Data Warehouse) vêem sendo muito indicadas para atender estas necessidades além de auxiliar na compreensão dos resultados e análise de tendências.

Por tanto, as justificativas para este trabalho são a real necessidade da aplicação na Fusesc e a possibilidade pessoal de adquirir e consolidar conhecimento sobre o assunto.
1.4 Organização do Trabalho

a) Por meio de entrevistas e baseado nas diferentes visões através das quais os usuários analisam as informações, caracterizadas as necessidades de informações.

b) Definição dos objetivos do sistema.

c) Avaliada a viabilidade do atendimento das necessidades identificadas, em função da disponibilização das informações operacionais necessárias, verificando se os dados existentes no ambiente da empresa suportam as análises identificadas.

d) Identificação da arquitetura da solução – Data Warehouse Bus Architecture.

e) Identificação do projeto – “Data Mart SIM”.

f) Definição da equipe: aluno, orientador e demais membros da banca.

g) Tempo esperado para conclusão – 6 meses.


2- FUNDAMENTAÇÃO TEÓRICA
2.1 Planos de Saúde

A Caixa de Assistência – SIM - é uma entidade sem fim lucrativo que tem por objetivo o fornecimento de serviços assistenciais aos seus associados e respectivos dependentes. Os seus associados são todos os empregados ativos das empresas patrocinadoras (BESC, CODESC, BADESC, BESCOR E FUSESC), os assistidos pela FUSESC (aposentados e pensionistas), e os mantenedores, desde que regularmente inscritos.

Os recursos para custeio dos serviços assistenciais são provenientes das contribuições das empresas patrocinadoras, das contribuições e jóias dos associados, e do valor da participação financeira dos associados sobre os serviços efetivamente utilizados.

Conforme a lei que regulamenta os planos de saúde, o SIM está classificado como plano de "auto-gestão", ou seja, gestão própria dos recursos e dos serviços oferecidos, com enquadramento legal específico, em face da finalidade não lucrativa.

Pelo contrato firmado desde 1986, a Unimed tem a função de prestar os serviços médicos previstos no Regulamento do SIM, a todos os associados, e em todo o território nacional, através de sua rede de serviços credenciados.

Mensalmente, a Unimed e as clínicas conveniadas emitem as faturas dos serviços (consultas, exames, internações), efetivamente utilizados pelos associados, a serem pagas pelo SIM. Estas faturas são importadas pelo sistema transacional para cálculo da participação financeira dos associados sobre os serviços, pagamento devido às clínicas ou Unimed e eventuais glosas de serviços indevidos.

Este é um ambiente convencional de processamento de transações que é fundamentalmente diferente de um ambiente de dados para suporte aos processos de gerência e tomada de decisão.
2.2 Sistemas de Informações

Um Sistema de Informações Gerenciais (SIG) pode ser definido como o processo de transformação de dados em informações que são utilizadas na estrutura decisória da empresa e que proporcionam a sustentação administrativa visando à otimização dos resultados esperados (Rebouças de Oliveira, 1993).

Kroenke (1992) define sistema de informação como o resultado da interação dos seus elementos, definidos pelo seu autor como hardware, software, dados e peopleware.

Um sistema de informações pode também ser tecnicamente definido como um conjunto de procedimentos que coletam, processam, armazenam e disseminam informações para o suporte na tomada de decisões, coordenação, análise, visualização da organização e controle gerencial. Em suma, esses procedimentos devem permitir que a informação chegue no tempo certo e na forma certa, para a pessoa certa.

Tal como o conceito de sistemas de informações, os conceitos de dados, informações e conhecimentos variam na literatura especializada, mas existe um consenso de uma hierarquia de complexidade onde os dados constituem a parte mais simples e o conhecimento a parte mais complexa da mesma.

Dado é qualquer elemento identificado em sua forma bruta que por si só não conduz a uma compreensão de determinado fato ou situação. Se atribuirmos um significado especial a um dado, este se transforma em uma informação. Informação, então, é o dado trabalhado e a transformação desta em conhecimento vem do confronto entre um determinado fato (informação) e uma determinada regra ou parametrização estipulada em geral por especialista no domínio específico tratado.



2.2.1 Data Warehouse

"Data Warehouse é um banco de dados orientado por assunto, integrado, não volátil e histórico, criado para suportar o processo de tomada de decisão." Willian H. Inmon.

Principais características do DW:


  1. Orientado ao Assunto;

  2. Integração;

  3. Não – Volátil;

  4. Dados relativos a um determinado Tempo

O data warehouse se distingue dos modelos de banco de dados transacionais devido principalmente pela utilização de modelo de dados multidimensionais que oferece suporte a várias ferramentas e tecnologias que auxiliam na tomada de decisão. Esses modelos de dados utilizam matrizes multidimensionais denominados de cubo de dados. Ao se realizar uma consulta onde os dados se encontram em forma de cubos é possível combinar as varias dimensões diminuindo a complexidade das consultas.

Com os conceitos acima descritos, pode-se dizer que um DW é como um depósito de dados integrados oriundos de várias fontes, processados para armazenamento em um modelo multidimensional, e oferecendo um enfoque histórico para permitir um suporte efetivo a decisão.

Na construção de um data warehouse são filtrados e normalizados os dados de vários bancos de dados dos sistemas estruturados, formando uma base de dados com todos os dados relevantes da empresa ou de uma área específica. Com o cruzamento desses dados extraem-se informações que os sistemas de informações estruturados não conseguem identificar.


2.2.1.1 Abordagem "Bottom-Up" e "Top-Down"

Ralph Kimball sugere que o DW deve ser "divido para depois ser conquistado", construindo-se Data Marts para posteriormente chegar-se ao Data Warehouse. Inmon sugere que o DW deva ser projetado de forma una, modelando-se toda a empresa e chegando-se a um único modelo corporativo, partindo-se posteriormente para os Data Marts.

Em seu artigo "Divide and Conquer", Kimball começa discorrendo sobre a necessidade de se ter conceitos corporativos que atendam às necessidades da empresa como um todo. A criação e manutenção dos conceitos corporativos não são tarefas da área de TI, e sim da alta cúpula da corporação e dos usuários de informações.

No que tange aos Data Marts, Kimball diz que eles não devem ser departamentais, ou seja, os Data Marts devem ser orientados aos dados, ou fontes de dados. Exemplificando, se um banco possui uma fonte de dados de contas correntes e poupança, então um Data Mart de Contas deve ser criado. Este não será um Data Mart proprietário da área financeira e nem da área de Marketing, será sim um Data Mart que terá como público todos os usuários de todos os departamentos que lidam com aquele assunto. Isso seria possível uma vez que os conceitos corporativos abordados acima já estariam disponíveis e implantados, dando a toda empresa uma visão única sobre sue negócio.

Transcendendo os conceitos corporativos, que até então tem um cunho de negócios, para uma visão tecnológica, Kimball propõe a criação de tabelas Fato e Dimensão em conformidade, ou seja, tabelas que serão utilizadas por diferentes usuários e Data Marts. Desta forma, informações entre os diferentes Data Marts poderiam ser geradas de maneira íntegra e segura. A este conceito Kimball dá o nome de Data Warehouse Bus Architecture. Metodologia adotada neste trabalho.

Segundo o autor, o Data Warehouse Bus Architecture seria como um livro de receitas para a construção de Data Warehouses nas grandes empresas. O problema (DW) seria divido em partes e resolvido incrementalmente, de maneira íntegra e escalável. Comercialmente esta abordagem tem o nome de "Bottom-Up".

Bill Inmon, especificamente em "Data Marts and the Data Warehouse: Information Architeture for the Millenium", discorre sobre a sua CIF (Corporate Information Factory) como infra-estrutura ideal para ambientar os dados da empresa, desde seus sistemas transacionais até a disponibilização de informações gerenciais ao usuário final.

O ponto de partida da CIF são os sistemas transacionais, ou legados, onde as transações do dia-a-dia da corporação são registradas em seu máximo detalhe. Os sistemas legados servem de fonte de dados para o grande Data Warehouse e para o ODS (Operational Data Store).

A construção de um ODS é facultativa, entretanto, ajuda em muito a diminuir os esforços de construção de um DW. Todo o esforço de integração entre os sistemas transacionais da empresa seriam depositados no ODS e a carga do Warehouse seria simplificada de maneira incomensurável.

No Data Warehouse estaria modelado de maneira atômica e levemente desnormalizado todo o negócio da empresa. Segundo Inmon, o DW deve ser modelado desta forma por que servirá de fonte de dados para diversos tipos de aplicações como Data Marts e Data Mining. A manipulação da informação fica muito facilitada com os dados estruturados desta maneira.

Emanando do Data Warehouse, seriam criados os Data Marts. Uma vez que os dados da empresa já estão integrados no Data Warehouse, os Data Marts que atenderiam os diversos departamentos da empresa gerariam dados íntegros e corporativos.

Por defender uma abordagem "Top-Down", Inmon destaca a necessidade de um efetivo envolvimento do Usuário de Negócios e da alta cúpula organizacional na construção do DW. Este envolvimento é muito importante na concepção de conceitos corporativos, uma vez que no DW deverão estar presentes dados integrados dos diversos legados, e no levantamento dos reais requisitos informacionais.


2.2.1.2 Metadados

Os metadados são definidos como dados dos dados, informações sobre informações, informações de como as informações estão estruturadas. Num projeto de DW, deve-se gerar documentação sobre o levantamento de dados, do banco de dados, relatórios a serem gerados, origem dos dados que alimentam o DW, processos de extração, tratamento e rotinas de carga dos dados, além das regras de negócio da empresa e todas suas mudanças.


2.2.2 Data Mart

O Data Mart pode ser definido como um subset do Data Warehouse. Construído com um escopo menor de informações, segmentado para uma determinada área ou processo do negócio.

Por ser menor possibilita a Análise Multidimensional com os cruzamentos e visões previamente calculadas, visando aumentar a velocidade na consulta das informações. Pode ser controlado pela própria área de negócio a qual atende, além de ter menor custo e esforço para implementação inicial.
2.2.3 On-Line Analytic Processing (OLAP)

O OLAP é processamento analítico em tempo real que proporciona as condições de análise de dados on-line necessárias para responder às diversas consultas dos analistas, gerentes e executivos. As ferramentas OLAP são as aplicações onde os usuários finais fazem a consulta e análise dos dados contidos nos Data Warehouses e Data Marts, com as seguintes características: consultas ad-hoc (casuais e únicas), slice-and-dice (análise das informações de diferentes prismas), drill down/up (exploração em diferentes níveis de detalhe das informações), queries (consultas simples ao OLAP).


2.2.4 Data Mining

Data Mining (ou mineração de dados) são ferramentas que utilizam técnicas de consultas e pesquisas no DW e através de algoritmos específicos conseguem encontrar padrões de comportamento nas informações armazenadas e apresentá-lo de forma relevante aos seus usuários. Significa a descoberta de conhecimento a partir da mineração em grandes bases de dados corporativas que freqüentemente contêm tendências desconhecidas, relações entre objetos são de importância estratégica para a organização.


3. METODOLOGIA
3.1 Escopo

O principal objetivo deste projeto é obter um maior conhecimento sobre o atendimento prestado aos participantes do plano. Este conhecimento será muito valioso para descobrir possibilidades de fraude e nas futuras decisões acerca de alterações ou reajustes no plano, além da implementação de programas de saúde preventiva, evitando futuras despesas ao plano e melhorando a qualidade de vida do participante.

Portanto o escopo deste trabalho é o serviço prestado ao participante do plano, e a coleta de informações está focada nos arquivos de faturas enviados mensalmente pelas clínicas médicas, hospitais, laboratórios e Unimeds regionais.

3.2 Exclusão do Escopo

Os serviços odontológicos prestados aos participantes do plano estão excluídos do escopo deste trabalho, embora possam vir a ser futuramente incluídos neste ou em um novo Data Mart, conforme análise futura. Estes serviços possuem características diferentes dos serviços médico/hospitalares, como tabelas próprias e faturas não padronizadas, além de dados históricos incompletos no atual sistema transacional.


3.3 Proposta

A metodologia deste trabalho é composta por:

• revisão bibliográfica dos conceitos: Sistema de Informações Gerenciais (SIG), Sistemas de Apoio à Decisão (SAD), Data Warehouse, Data Mart e Ferramentas OLAP;

• levantamento dos requisitos do usuário considerando os dados existentes no sistema transacional da empresa;

• escolha da abordagem de desenvolvimento: escolhido "Bottom-Up", já que atualmente a empresa desconhece a tecnologia, torna-se mais prático criar um banco de dados para uma área e através da visualização dos resultados decidir pela implementação em outras áreas, chegando ao Data Warehouse;

• modelagem do esquema estrela, com as tabelas de fatos e dimensões. Inclui a definição da granularidade e do particionamento. A granularidade diz respeito ao nível de detalhamento dos dados contidos em seu interior, quanto maior o nível de granularidade menor é o grau de detalhamento dos dados e vice-versa, já o espaço necessário para o armazenamento dos dados aumenta com a granularidade. O particionamento consiste em dividir tabelas grandes e índices em partes menores e de mais fácil gerenciamento;

• carga dos dados do banco de dados atual;

• dicionário de dados (metadados);

• ETL - extração, limpeza, transformação e migração de dados do sistema transacional para o Data Mart;

• construção dos cubos para aplicação da ferramenta OLAP;

• definição da periodicidade da atualização;

• aplicação de questões com a ferramenta OLAP;

• análise dos resultados da aplicação da ferramenta OLAP.

A ferramenta OLAP (ferramenta usada para trabalhar com os dados quando os mesmos utilizam a Modelagem Dimensional) escolhida será o Microsoft Excel por ser uma ferramenta de fácil utilização, a única existente na empresa e que possui todos os recursos necessários para realizar as consultas requeridas. O formato de pesquisa é o de planilhas bi-dimensionais com recurso de drill-down que poderão vir a ser desenhadas pelos próprios usuários e, após serem salvas, permitirão sua reutilização sempre com os dados da atualização mais recente.



4. BIBLIOGRAFIA

KIMBALL, Ralph. The data warehouse lifecycle toolkit: expert methods for designing, developing, and deploying data warehouses. New York: John Wiley & Sons, c1998. 771p.


INMON, W.H. Como Construir o Data Warehouse [Building the data warehouse]. Editora Campus, 1996.
SELL, D. Uma Arquitetura para Distribuição de Componentes Tecnológicos de Sistemas de Informações Baseados em Data Warehouse. 2001. Dissertação

(Mestrado em Engenharia de Produção) Universidade Federal de Santa Catarina,



Santa Catarina.
SOUZA, M. iMasters B. Intelligence. Obtida via internet.

http://www.imasters.com.br/artigo.php?cn=1409&cc=59.
Tecnologias Data warehouse e OLAP. Obtida via internet.

http://jacques.ic.cti.br/ic/pqps/atps/dw.htm.
Material Prof. Dr. José Leomar Todesco. Obtida via internet.

http://www.stela.ufsc.br/~tite/dw/


©principo.org 2016
enviar mensagem

    Página principal