domingo, 3 de novembro de 2019

Big Data e DATA-WAREHOUSE - Uemerson Pinheiro Junior e Gustavo Alencar

Big Data e DATA-WAREHOUSE

Discente 1: Uemerson Pinheiro Junior
Discente 2: Gustavo Alencar Rocha

Big Data

Introdução
Big Data é um conceito utilizado para caracterizar dados que excedem a capacidade de processamento de sistemas de banco de dados convencionais (Henriques et al., 21-?). Para Ragazzo e Monteiro (2018) em linhas gerais o termo big data se refere “a um grande volume de dados digitais variados, que são coletados, armazenados e processados analiticamente em alta velocidade, particularmente com o objetivo de identificar padrões e comportamentos e fazer correlações, extraindo-se, dessa forma, informações relevantes que lhes conferem valor e podem ser utilizadas em processos de decisão informada nas mais variadas áreas”. Beyer e Laney (2012) define que big data “são grandes volumes de dados de alta velocidade, e/ou alta variedade de informações que requerem novas formas de processamento para possibilitar uma eficiente 25 tomada de decisão”. De acordo com a empresa IBM (2018), big data é um termo usado para conjuntos de dados de que tamanho ou tipo está além da capacidade dos tradicionais bancos de dados relacionais de capturar, gerenciar e processar os dados com baixa latência. E possuindo uma ou mais das seguintes características: alto volume, alta velocidade ou alta variedade. Observando as definições dos autores sobre big data, compreende-se que esse termo é aplicado para conjuntos de dados que extrapolam os limites dos bancos de dados relacionais tradicionais. Além disso, esses conjuntos de dados precisam ter características especificas que os diferenciam de dados normais, tais como: grande volume de dados, processamento desses dados em alta velocidade e alta variedade de dados.
Big Data era caracterizado e definido por três características essenciais, sendo elas o volume, a variedade e a velocidade dos dados (Laney, 2001). Com novos estudos efetuados sobre big data, foram adicionadas duas novas características a veracidade e o valor. Segundo Menezes (2014) a característica volume se refere a uma quantidade de dados armazenada em larga escala, o que torna impossível sua analise na totalidade com os sistemas tradicionais de gestão de Base de Dados. O autor ainda define que a característica variedade representa todos os tipos de dados como parte do processo de decisão. Para o autor a característica a velocidade, consiste na rapidez em que os dados chegam e são armazenados. É citado pelo autor que A veracidade é a garantia da consistência dos dados, nomeadamente, a sua origem, recolha e métodos de processamento, utilizando infraestruturas confiáveis. Para o autor o valor é uma característica importante pois define o valor agregado que os dados recolhidos podem trazer para o processo, atividade ou análise a que se destina.
A seguir é apresentado a seção objetivos, a qual será detalhado os objetivos do presente trabalho.

Objetivos
O presente trabalho tem como objetivo definir o que é big data, definir suas características e por último, mas não menos importante mostrar as vantagens que a analise de big data pode trazer para as empresas.

Justificativa
É importante antes de entrar nas vantagens do big data para as empresas definir o que é big data e quais são suas características. Desta forma no capitulo de introdução foi definido o que é big data, que resumidamente é um conjunto grande de dados, que está além da capacidade dos tradicionais bancos de dados relacionais de capturar, gerenciar e processar os dados com baixa latência. E suas características são: volume, variedade, velocidade dos dados, veracidade e o valor.
De acordo com Fontes et al. (2016) “big data é capaz de apresentar os caminhos e paralelismo encontrados em grandes volumes de dados, no menor tempo possível, para que as empresas analisem estes dados com a intenção de obter vantagens competitivas”. Ainda o autor cita que por meio do big data é possível as empresas fazerem infinidades de análises, pesquisas e relatórios das mais diversas fontes e tipos. O autor também cita alguns casos de uso do big data em empresas, como por exemplo o caso da rede de lojas Renner que utilizou o big data para cruzar as informações de uma pesquisa realizada com usuários do Facebook, essa pesquisa tinha como objetivo saber o interesse do público sobre o lançamento de uma nova coleção de roupas ou acessórios, o que possibilitou que a rede de lojas pudesse ter um maior controle sobre o estoque em determinadas lojas de determinadas regiões, e sobre os pedidos que deveriam ser feitos.
Maçada et al. (2015) cita dois casos de sucesso onde big data é aplicado nas empresas, o primeiro é a do Google flutrends, onde conseguiu mapear as buscas sobre a doença, para saber onde poderá surgir um novo surto. A epidemia de ebola foi melhor gerenciada quando cientistas de dados, participaram de um movimento internacional para evitar que a epidemia tivesse maiores proporções. O segundo caso é das empresas varejistas Macy’s onde conseguiu fixar os preços em tempo real de 73 milhões de itens de suas lojas e realizar promoções rapidamente a partir do comportamento da demanda e estoque em cada uma das unidades espalhadas nos Estados Unidos. E da empresa Wal­Mart que buscou recursos para analisar os seus dados e, por meio da adição de busca semântica, tem melhorado a finalização de compras on­line de 10% para 15%, o que significam milhares de milhões de dólares.
Com base nesses casos de uso, é notável que as empresas que utilizaram o big data obtiveram de alguma forma vantagens, seja econômica ou competitiva, além é claro de ter um controle maior dos seus dados. Desta forma é importante ressaltar que o big data é algo valioso para as empresas e quando usado de uma maneira correta traz inúmeras vantagens para a empresa.
Na próxima seção é abordado as considerações finais do presente trabalho.

Considerações Finais
Com base nas seções anteriores é big data, já não são apenas prospecções e sim realidade. As empresas devem investir em big data, e ao aderir-se ao big data, as informações por ele geradas deverão ser analisadas por profissionais capacitados para que estratégias sejam criadas e assim consequentemente seguir forte na concorrência pelos clientes e consumidores. Para isso é necessário capacitar os funcionários para lidar com a nova solução, ou terceirizar uma empresa que faça o gerenciamento de toda esta cadeia.
Com base nas vantagens econômica ou competitiva, além é claro de ter um controle maior dos seus dados que o big data trás para as empresas, é viável as empresas fazerem investimentos nessa área, e as que não fizerem ficaram para trás. Isso porque o mundo cada vez mais gera dados, e as empresas que não trabalharem suas estratégias de comercio em cima desses dados estão fadadas a falirem.

Referências
BEYER, M. A.; LANEY, D. The importance of ‘big data’: a definition. Stamford, CT: Gartner, p. 1–9, 2012.
FONTES, N. R.; SILVA, G.; ALMEIDA, J. W. R. UTILIZAÇÃO DO BIG DATA PARA OBTER VANTAGENS COMPETITIVAS. 2016. Disponível em: <http://www.fatecguaratingueta.edu.br/revista/index.php/RCO-TGH/article/view/121>. Acesso em 02 novembro 2019.
HENRIQUES, M. S. B.; FURTADO, M. R. S.; SILVA. P. E. S; MORAVIA, R. V. Big Data. 21 - ?. Disponível em: <http://revistapensar.com.br/tecnologia/pasta_upload/artigos/a55.pdf>. Acesso em 02 novembro 2019.
IBM. Data Lake Analytics. 2018. Disponível em: < https://www.ibm.com/analytics/hadoop/big-data-analytics>. Acesso em: 29 outubro 2019.
LANEY, D. Controlling Data Volume, Velocity, and Variety. 2001. Disponível em: <http://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf>. Acesso em: 02 novembro 2019.
MAÇADA, A. C. G.; BRINKHUES, R. A.; FREITAS JÚNIOR, J. C. Big data e as capacidades de gestão da informação. 2015. Disponível em: < https://www.researchgate.net/profile/Rafael_Brinkhues/publication/279965068_Big_data_e_as_capacidades_de_gestao_da_informacao/links/55a0a15408ae967fb3e97c60/Big-data-e-as-capacidades-de-gestao-da-informacao.pdf>. >. Acesso em 02 novembro 2019.
MENEZES, C. S. V. C. Big City Data: Uma nova dimensão sobre as cidades. 2014. Disponível em: <https://repositorium.sdum.uminho.pt/bitstream/1822/35216/1/Disserta%c3%a7%c3%a3o_C%c3%a1tia%20Sofia%20Vaz%20de%20Menezez_2014.pdf>. Acesso em 02 novembro 2019.
RAGAZZO, C.; MONTEIRO, Gabriela. Big Data e Concorrência: Quando Big Data é Uma Variável Competitiva em Mercados Digitais e Deve Ser Considerada na Análise Concorrencial? 2018. Disponível em: <https://portalrevistas.ucb.br/index.php/EALR/article/view/9436/pdf>. Acesso em 02 novembro 2019.

DATA WAREHOUSE

Resumo
De modo simples, Data Warehouse (Armazém de Dados), pode ser definido como um banco especializado, que gerencia de forma integrada o fluxo de informações contidas nos bancos de dados de uma organização e fontes de dados externa à empresa.
O Data Warehouse gera sues dados de forma integrada e de forma histórica, para o auxiliar os gestores a tomarem decisões embasadas em fatos inibindo o uso de especulações e intuições. Conhecer essa tecnologia permite que a empresa tenha um diferencial dentro de uma economia globalizada como essa em que vivemos, proporcionando uma flexibilidade em relação a elaboração de diferentes estratégias a fim de chegar no seu cliente final.
O presente artigo visa importância do Data Warehouse nas empresas, organizações, etc., trazendo algumas definições e características dessa tecnologia e por fim, considerações finais.
Introdução
Ter a capacidade de analisar, planejar e reagir de forma rápida e efetiva às mudanças do mercado é um dos fatores relevantes para o sucesso de uma organização. Para tal feito a empresa precisa se dispor de melhores e mais informações de base destes processos.
Essa tecnologia possibilita a manipulação de um grande volume de dados e trocas de informações em escala mundial, excluindo fronteiras e respostas com o menor tempo possível e a utilização de um sistema de apoio a decisão tem sido um diferencial dentro das empresas.
Dados dos mais variados tipos são gerados e armazenados diariamente. Entretanto, essas informações estão de modo geral, espalhadas nos mais diversos sistemas, exigindo um esforço considerável para obtê-las e consequentemente dar suporte e auxílio nas tomadas de decisões.
Por esse motivo, esse conceito e ferramentas tem ganhado cada vez mais espaço, o Data Warehouse é um deles, oferecendo uma maneira flexível e eficiente de obter as informações necessárias para chegar numa melhor decisão.
A importância do Data Warehouse nas empresas
Devido ao grande volume de informações e de computadores conectados, as empresas têm utilizado sistemas informatizados para a realização de processos importantes. Os sistemas convencionais não são projetados para armazenar informações estratégicas, o que torna os dados gerados vagos, sem oferecer qualquer apoio aos processos decisórios, decisões essas que são tomadas por meio da experiência dos administradores, que no caso poderiam ser baseados no histórico de dados armazenados. O uso desse histórico de dados, possibilita a identificação de uma potencial tendência no mercado, consequentemente posicionando a empresa de forma estratégica para ser mais efetiva quanto ao serviço e/ou produto que presta ou oferece.
Essa necessidade surgiu, quando os sistemas e aplicações comerciais, não conseguiam atender aquilo que era proposto por eles, mesmo gerando dados. Pensando nisso, conceituaram que a melhor forma de usar esses dados era, agrupá-los adequando aos seus usuários finais, obtendo um formato mais útil dos dados, permitindo assim, a análise e distribuição para os grupos competentes, aumentando a disponibilidade e acessibilidade. A organização dos dados, da melhor maneira possível dão o subsídio das informações que os gerentes e diretores das organizações precisam para que possam tomar decisões.
Definição de Data Warehouse
O Data Warehouse é um conjunto de técnicas que quando aplicadas juntas gera um sistema de dados que proporcionam informação para o apoio a tomadas de decisão. Cliente/Servidor é a sua arquitetura.
O warehouse extrai dados dos ambientes de produção da empresa, que foram selecionados e depurados, sido otimizados para o processamento e consultas. A diferença entro o Data Warehouse e o Banco de Dados convencional é que, ele permite possuir uma enorme quantidade de dados de múltiplas fontes, podendo incluir o banco de dados de diferentes modelos e arquivos de sistemas independentes e plataformas.
Sistemas de DW revitalizam os sistemas da empresa pois permite que sistemas mais antigos continuem em operação, consolidadão dados inconsistentes, extraem benefícios de novas informações oriundas das operações correntes, provêm ambientes para o planejamento e arquitetura de novos sistemas de cunho operacional.
Um Data Warehouse é construído para que tais dados possam ser armazenados e acessados de forma que não sejam limitados por tabelas e linhas estritamente relacionais. Elmasri e Navathe (1994) complementam ao afirmando que ele é um modelo de dados multidimensional que armazena dados de forma integrada e disponibiliza séries no tempo e análises de tendências por meio de banco de dados histórico e sem volatilidade. É interessante salientar que o DW está separado dos bancos de dados operacionais, portanto as consultas dos usuários não impactam nestes sistemas, que ficam resguardados de alterações indevidas ou perdas de dados.
Stair e Reynolds (2002) atestam que como o propósito do DW é suportar requisições de informações, esse tem como características: fonte de dados de arquivos múltiplos, de banco de dados internos e externos; os acessos dos usuários são para somente leitura; o modo de acesso primário aos dados se dá por consultas simples ou complexas, com uso crescente do data mining; utilização de um modelo de banco de dados relacional e multidimensional; os níveis de detalhes são frequentemente resumidos; dados históricos de múltiplos anos; há um processo periódico de atualização, mas esses são complexos, já que se combinam diversas fontes; e é necessário um grande esforço de limpeza dos dados para que esses fiquem íntegros.
Características do Data Warehouse
O DW possui algumas características tais como a orientação por assunto, a integração, variação no tempo, não volátil e sendo o mais importante a localização, credibilidade de dados e granularidade.
Orientação por assunto – Essa característica determina, por meio dos principais assuntos da empresa de como será feita a modelagem. Pois esse é o foco do DW, quando comparado aos sistemas de processos e aplicações específicas, ou seja, o sistema trabalha em torno de uma área estratégica escolhida pela empresa.
Integração – Por meio dela é possível padronizar de forma única os dados de formação do DW. A sua construção está basicamente na análise de dos sistemas de transação e nos dados contidos neles. Normalmente as empresas utilizam uma série de programas e é comum que esses sistemas não tenham um padrão no seu código de banco de dados, e isso no DW jamais deverá existir, por isso é realizada essa integração.
Varição no Tempo – São variáveis em relação ao tempo, seus dados ficam armazenadas em um período muito maior em relação aos sistemas transacionais, referindo-se a um momento específico, não atualizável, quando existe uma mudança, alteração, etc., uma nova entrada é criada para o registro dessa ocorrência. E por não atualizar esses dados gerados quando gerados, pode se dizer que vamos ter uma imagem fiel da época em que os dados foram gerados.
Não Volatilidade – No DW existem apenas duas operações, a carga inicial e as consultas dos front-ends aos dados. Após os dados serem tradados, eles são carregados em formato de blocos para o data warehouse, a fim de estarem disponíveis para os usuários. “No ambiente operacional, ao contrário, os dados são, em geral, atualizados registro a registro, em múltiplas transações. Esta volatilidade requer um trabalho considerável para assegurar integridade e consistência. Um data warehouse não requer este grau de controle típico dos sistemas orientados a transações, pois, no DW o que acontece é somente ler os dados na origem e gravá-los no destino, ou seja, no banco modelado multidimensional” - Gabriela, André e Felipe.
Localização – Os dados podem estar armazenados de três formas:
1.      Pode estar em apenas um local, a intenção desse formato de armazenado é maximizar o poder de processamento e agilizar a busca dos dados, sendo o mais utilizado, porém existe um investimento relativamente considerável em um hardware capaz de suportar a volumosa base de dados e uma capacidade de processamento apto para atender a quantidade de buscas instantâneas realizadas pelos usuários.
2.      Os distribuídos, são dados armazenados baseados na área de interesse, ou seja, cada setor possuí um servidor onde seus dados gerados são armazenados, dessa forma é possível atender a demanda de buscas feitas simultaneamente evitando a sobrecarga do servidor.
3.      Por nível de detalhes, que são separados em níveis de importância. Os dados são armazenados de forma resumida no primeiro servidor, dados intermediários em um segundo servidor e os dados mais detalhados no terceiro servidor por exemplo, onde os primeiros níveis armazenariam menos dados e com um muito mais acessos simultâneos e as camadas superiores, onde estariam os dados mais específicos e intermediários, com a capacidade de armazenamento maior e com baixo número de acesso.
Credibilidade dos Dados – É de suma importância para o sucesso de qualquer organização o trabalho com dados verídicos, pelo simples motivo de que esses dados servem de apoio para processos decisórios da empresa, podendo causar sérios problemas caso esses dados sejam falsos ou adulterados, gerando relatórios inúteis e decisões que comprometeram o futuro da empresa.
Granularidade – Nada mais é que o nível de detalhe ou resumo dos dados existentes no DW. Quanto maior for o nível de detalhes, menor será o nível de granularidade. Isso afeta diretamente na capacidade de armazenamento e na resposta à consulta.
Quanto maior for o nível de granularidade, menores são os recursos necessários como o espaço em disco e o número de índices, porém diminuí a possibilidade da consulta dos dados de forma detalhada.
Com o nível de granularidade for baixo, é possível responder basicamente qualquer consulta, mas exige muito dos recursos computacionais. Entretanto, no DW, dificilmente um evento isolado será examinado, sendo provável a utilização de um conjunto deles.
Dados levemente resumidos correspondem ao nível intermediário da estrutura do DW e quase sempre é armazenado no disco. Os dados que chegam nesse nível, sofrem alterações.
Os dados altamente resumidos devem ser de fácil acesso, pois e deles que os Sistemas de Informações Executivas conseguem as informações valiosas, enquanto os níveis anteriores para os Sistemas de Apoio a Decisão por trabalharem de forma analítica portanto precisam de dados com informações mais amplas.
O balanceamento no DW tem um aspecto crítico no planejamento, pois exige eficiência no armazenamento e no acesso dos dados, como também, pela capacidade de analisar esses dados em um maior nível de detalhes.
Conclusões Finais
A utilização do Data Warehouse permite o armazenamento de dados em níveis, como também a geração de dados integrados e históricos para o auxílio nos processos de tomada de decisão das organizações de forma ágil e eficiente, mostrando o quanto é útil sua utilização no mercado, para um melhor planejamento dos próximos passos que uma organização pode dar e se posicionar melhor no mercado.
Referências
DATAWAREHOUSE. Disponível em: <www.datawarehouse.inf.br.>
CAVALCANTI, Gabriela Góis; FELL, André Felipe de Albuquerque; DORNELAS, Jairo Simião (Ed.). Data Warehouse: uma ferramenta de tecnologia de informação para as organizações. Bauru: Gabriela Góis Cavalcanti, 2005. 12 p. DATA WAREHOUSE. Disponível em: <www.datawarehouse.com>.
ELMASRI, Ramez.; NAVATHE, Sham.. Fundamentals of database systems. 2nd ed. - Redwood City Calif. : Benjamin/Cummings, c1994

7 comentários:

  1. Alunos:Gabriel Ferreira Soares,Aleska Marques , Bruna Leonel

    Comentário: Uemerson Pinheiro Junior falou sobre a definição de big data,características,vantagens,considerações finais.Gustavo Alencar falou sobre big data e data warehouse sobre a definição,importância do data warehouse nas empresas,características do data warehouse e conclusões finais.E um mercado que esta faltando profissionais qualificados para atuar na área.

    ResponderExcluir
  2. Definiram bem big data e seus conceitos principais, gostei da apresentação que foi sucinta e objetiva ao mesmo tempo.

    ResponderExcluir
  3. Para se ter uma ideia da importância corporativa do Big Data, esse mercado cresce, a cada ano, cerca de 40%. A expectativa é que em poucos anos, haja um crescimento ainda mais significativo pela utilização do Big Data e, consequentemente, um aumento ainda maior da procura de mão de obra especializada.

    ResponderExcluir
  4. O conceito de Big Data esta difundido hoje no mercado da tecnologia, o grande volume de dados cresce exponencialmente, fazer com isto transforme em informação é uma tarefa essencial e estes modelos se tornam uma grande ferramenta para as organizações, trazendo uma nova era do mercado da informação

    ResponderExcluir
  5. No Brasil, um dos principais motivos para a adoção do big data é a necessidade de redução de custos. E quando se pensa em obter bons resultados e inovação, o potencial de crescimento da tecnologia prova que tem muito a oferecer.

    ResponderExcluir
  6. O uso intensivo de dados (big data) é uma das principais características dos negócios digitais. O mercado lida, hoje, com uma quantidade enorme de informações e isso só tende a aumentar no futuro. Afinal, quanto mais os consumidores estão conectados online e se relacionam com as empresas por diversos pontos de contato, mais elementos sobre o seu comportamento passam a ser registrados.

    ResponderExcluir
  7. A importância de se implantar BIG DATA nas organizações não gira em torno apenas de como ou quanta informação chega até você e sua empresa e sim do que você faz com ela, como utilizar e interpretar todos esses dados é o primeiro passo para se ter sucesso com esse recurso. Usar os dados de forma inteligente para melhorar o seu negócio é tão importante quanto se ter esses dados.

    ResponderExcluir