MD2 Consultoria e Negócios


INFORMATION SERVER®

A solução IBM® Information Server provê enorme produtividade e redução de custos em projetos de integração de dados, oferecendo aos seus clientes uma arquitetura unificada que reúne de maneira integrada módulos independentes para cada necessidade de negócio, desfrutando dos mais avançados algoritmos e técnicas de paralelismo. Recursos que facilitam o controle e administração, juntamente com uma interface única de implementação destes serviços, fazem deste conjunto a solução ideal para empresas que vivenciam necessidades de integrar e tratar suas informações para utilizá-las como vantagem competitiva.

A suíte IBM® Information Server® inclui os seguintes módulos:
IBM® InfoSphere® DataStage Server® | IBM® InfoSphere® DataStage Enterprise Edition® | IBM® InfoSphere® DataStage MVS Edition® | IBM® InfoSphere® QualityStage | IBM® InfoSphere® Information Analyzer® | IBM® InfoSphere® Services Director® | IBM® InfoSphere® Business Glossary® | IBM® InfoSphere® Data Replication® (CDC) | IBM® InfoShere Pure Data For Analytics (Netezza™)

O alto poder de paralelismo na execução é um dos pontos fortes desta nova arquitetura. O IBM® InfoSphere® DataStage® & QualityStage® possui a capacidade de otimizar a utilização do hardware disponível sem exigir preocupações de adequação nos processos de carga.



Parte integrante e carro chefe da suíte IBM® InfoSphere® Information Server®, o InfoSphere® DataStage® implementa estes recursos de paralelismo gerando código C++, baseando-se em arquivos de configuração que determinam, em tempo de execução, os recursos de hardware disponíveis para cada processo. Dessa forma, uma alteração no ambiente exige do usuário a edição e atualização do arquivo de configuração para que esta disponibilidade reflita automaticamente em todos os processos configurados para execução com paralelismo, independente do layout.



O IBM® InfoSphere® QualityStage® permite a definição de procedimentos de investigação, padronização e matching de dados que podem ser facilmente implementados graficamente como parte integrante dos fluxos de transferência das informações. Isso sem qualquer mudança na forma com que estes processos eram desenvolvidos. O tratamento da qualidade de dados corporativa deixou de ser um processo isolado e de baixa performance passando a ser uma mera questão de desenvolvimento que utiliza todo o poder de paralelismo e conectividade presentes no módulo ETL.



Além das funcionalidades citadas acima, esta arquitetura de integração de dados oferece aos usuários módulos independentes que funcionam de forma altamente integrada.

O IBM® InfoSphere® Business Glossary®, por exemplo, endereça as necessidades de manipulação e publicação de metadados alinhando os esforços da equipe de TI aos objetivos dos usuários de negócio. Oferece recursos de rastreabilidade comportando-se como centralizador do “significado” dos dados para cada comunidade de usuários.



Desta forma, atua como referência para o aprendizado sobre as informações corporativas incluindo significados, dependências, utilização, qualidade e propriedade destes dados. Este módulo possui interface totalmente baseada em Web, facilitando a criação e administração de um vocabulário de negócios e publicação de metadados em esquema colaborativo, permitindo que os usuários de negócios e usuários técnicos utilizem uma linguagem comum. Além disso, oferece buscas simples ou avançadas por assunto ou palavras-chave com total flexibilidade de uso e integração com os demais produtos da suíte, bem como avançados recursos de Reporting.

Para atividades de Profiling (análise de perfil dos dados), mandatória para qualquer projeto de Integração de Dados, a IBM® incorporou à suíte o módulo chamado “IBM® InfoSphere® Information Analyser®”. Este módulo reúne todas as características de análise de perfil dos dados, utilizando o repositório de metadados integrado e do poder de paralelismo da suíte.


Visão do Data Quality Dashboard provido pelo Information Analyzer®


A possibilidade de transformar todo este potencial de integração de dados em pequenos fragmentos funcionais vistos como “serviços” utilizando a tecnologia SOA, virtualiza os recursos desta arquitetura facilitando o acesso e aprimorando a disponibilidade sem imputar ao usuário final a relativa complexidade envolvida na sua utilização. Alto ganho em disponibilidade e escalabilidade são outros benefícios alcançados com a utilização desta tecnologia, que faz com que esta solução seja aderente à qualquer necessidade de negócio atual independente de questões como volume, latência ou complexidade envolvida nestes requisitos corporativos.



A Tecnologia IBM® InfoSphere® CDC (Change Data Capture), do fabricante IBM®, é capaz de identificar e capturar dados acrescentados, apagados ou atualizados em uma base e entregá-los, em tempo real, a processos, aplicações e bancos de dados, garantindo informações confiáveis e imediatas para decisões de negócios, ou seja, informações de qualidade em tempo real.



Como complemento às tecnologias de ETL tradicionais, a ferramenta IBM® InfoSphere® CDC provê um caminho otimizado para captura de dados em sistemas transacionais ou Data Warehouses, sem a necessidade de coletá-los diretamente nestas bases de dados. Evitando assim, qualquer impacto no seu ambiente de produção e a propagação imediata das informações a partir das bases transacionais.

A ferramenta possui muitos benefícios complementares às atividades tradicionais de ETL (Extração, Transformação e Carga de Dados) em vários casos, incluindo:

- Alterações de dados nos sistemas são capturadas em tempo real, assim as informações podem ser atualizadas dinamicamente nas aplicações táticas e estratégicas.
- Redução de impacto na performance dos sistemas de produção. O CDC lê os dados dos logs das aplicações ao invés de pesquisar diretamente em suas bases.
- Reduz processamento "batch". Com as alterações capturadas, transformadas e aplicadas continuamente, as atividades de ETL serão reduzidas na janela de processamento.

O IBM® InfoSphere® CDC® captura as alterações nas bases de dados monitoradas e as replica para sistemas de ODS ou bases temporárias. Assim, as ferramentas de ETL terminam a tarefa carregando os dados no Data Warehouse, ou o componente de CDC monitora e captura as alterações do Data Warehouse minimizando o trabalho de carga dos Data Marts.



Conheça sobre os benefícios da tecnologia IBM® InfoSphere® CDC.

A suíte IBM® InfoSphere® Information Server é a solução de Integração de Dados mais completa disponível atualmente no mercado. Todas as características citadas fazem desta arquitetura a resposta aos altos níveis de necessidades de integração contemplando todas as plataformas operacionais e tipos de aplicações corporativas.

BELO HORIZONTE | SÃO PAULO | RIO DE JANEIRO | BRASÍLIA