quinta-feira, 25 de junho de 2015

BIG DATA


Bruna Leitão Cortes[1]
Diego de Souza[2]
Rafael Rodrigues[3]
Stheve Midorikawa[4]

RESUMO

Big data representa para tecnologia um novo método de compreensão de dados, usuários todos os dias deixam rastros na internet, fazendo com que cresça cada vez mais  as informações. Banco de dados transacionais foram desenvolvidos para armazenar informações como as de compra e venda de mercadoria de produtos e clientes. A proposta de Big Data é não somente coletar, armazenar e apresentar dados ao usuário, mas também identificar qual produto pode ser oferecido a um determinado usuário.

ABSTRACT

Big data is a technology for a new method of data comprehesion, everyday users leave traces on the Internet, making it expand more and more the informations. Transactional databases are designed to store information about sellings and customers. The Big Data’s purpose is not only collect, store and present data to users but also identify which product can be offered to a particular user.

1 INTRODUÇÃO

Big Data se caracteriza por cinco aspectos: volume, velocidade, variedade e veracidade e valor.
Segundo Henriques e Costa (2013), a ISACA definiu Big Data como conjuntos de dados que são muito grandes ou com rápidas mudanças para serem analisados com técnicas de banco de dados relacionais tradicionais ou multidimensionais ou ferramentas de software comumente usadas para gerenciar, e processar dados em um tempo razoável.
O Big Data representa na tecnologia um novo método de compreensão do mundo e, do processo de tomada de decisões de negócios (ISACA, 2013) .
Todos os dias bilhões de usuários deixam rastros digitais ao fazerem o uso da internet, conforme Leandro Augusto esses dados estão gerando um imenso banco de dados, um grande volume de informação que cresce de maneira exponencial, vindo não somente de sistemas convencionais, mas também de fontes como Google, Facebook, Tweeter, YouTube, RFID, eletrônica embarcada, telefones celulares etc. o qual é denominado Big Data.
Big Data são zetabytes e brontobytes circulando na rede a cada instante somente no Facebook são 10 bilhões de mensagens, 4,5 bilhões de curtidas e 350 milhões de fotos compartilhadas todos os dias. A tecnologia do Big Data serve exatamente para lidar com esse volume de dados, guardando-os em diferentes localidades e juntando-os através de software (Redação da Canaltech, 2014).
Segundo Feijó, quando uma análise é bem feita leva o conhecimento de padrões de comportamento, até então desconhecidos, e ajuda a prever tendências de consumo. O grande desafio para as empresas é usar essas informações para se tornarem competitivas no mercado a velocidade com que os dados são capturados e processados (quase em real time) fazem com que essas empresas ganhem vantagem competitiva.
Velocidade refere à velocidade com que os dados são criados. São mensagens de redes sociais se viralizando em segundos, transações de cartão de crédito sendo verificadas a cada instante ou os milissegundos necessários para calcular o valor de compra e venda de ações. O Big Data serve para analisar os dados no instante em que são criados, sem ter de armazená-los em bancos de dados (Redação da Canaltech, 2014).
Existem variedades tais como dados que fogem das características tratadas pelos sistemas convencionais, e que vem de fontes diferentes, são dados não estruturados e refere-se a coisas como movimento por exemplo a movimentação que uma loja pode ter em uma determinada data, temperatura umidade (BRETERNITZ; SILVA, 2013).
Conforme Leandro Veracidade está ligado ao fato de que os dados podem não ser perfeitos e que talvez seja preciso trabalhar em cima deles para que seja possível obter alguma informação útil.
O último V (valor) é o que torna Big Data relevante: tudo bem ter acesso a uma quantidade massiva de informação a cada segundo, mas isso não adianta nada se não puder gerar valor. É importante que empresas entrem no negócio do Big Data, mas é sempre importante lembrar dos custos e benefícios e tentar agregar valor ao que se está fazendo (BRETERNITZ; SILVA, 2013).
O Big Data é muito importante para uma empresa por exemplo se ela quiser saber a estimativa de vendas em um determinado período do ano, como citado em nossa referência no artigo de Leandro Augusto ele citou um exemplo do grupo Macy's no Black Friday de 2011 eles capturaram dados relativos à localização de celulares de forma a inferir quantas pessoas estacionaram seus veículos no estacionamento  de lojas do Grupo Macy's. Esses dados que foram capturados deu a eles a estimativa com precisão das vendas que foram realizadas antes mesmo delas acontecerem.

2 OBJETIVOS

Neste capítulo serão abordados os objetivos do desenvolvimento deste trabalho.

2.1 Objetivo Geral

Mostrar como uma empresa consegue ter vantagens de competição através do entendimento correto do grande volume de dados gerados pelas novidades e pelo crescimento das novas tecnologias. Também serão tratados os efeitos dos fatores de volume, variedade, veracidade, valor e velocidade no processo de tomada de decisão de diferentes níveis de cargos.

2.2 Objetivos Específicos

i) Definir Big Data;
ii) Discutir e detalhar os impactos que o Big Data causa nas empresas;
iii) Verificar o efeito dos fatores (volume, variedade, veracidade, valor e velocidade) durante o processo de tomada de decisão, julgando qual deles tem mais efeito durante este processo;
iv) Verificar a diferença dos níveis de cargos na obtenção de resultados;
v) Mostrar os riscos e os benefícios que podem ser trazidos da utilização do Big Data.

3 JUSTIFICATIVA

De acordo com o crescimento do volume de dados, será exigido dos gestores mais formação e mais habilidades para lidar com grandes volumes de dados. E mesmo com tanto aumento, muitos destes gestores não estão enxergando esta realidade. Daí, forma-se uma oportunidade para negócios.
Tomada de decisão baseada em evidências (também conhecido como Big Data) não é apenas a última moda, é o futuro de como vamos orientar e fazer crescer o negócio (HAMMOND, 2013). Mercados se tornam, a cada dia mais, mais concorrentes em relação à competição por um pedaço do mercado. Porém, é fundamental para o sucesso da organização do mercado a tomada de decisão e a segurança ao optar por este negócio. Os tomadores de decisão devem saber gerenciar esse volume e todos esses variados dados, podendo aproveitar e filtrar mais informações úteis aos seus negócios, assim escolhendo rápido e mais precisamente.
O Big Data está exigindo mudanças no desenvolvimento de tecnologias, além de novas formas na coleta, processamento, armazenamento e a infra-estrutura das bases de dados. Esse desafio pode trazer benefícios e vantagens competitivas às organizações: "As empresas de hoje devem ter consciência do aumento do volume, velocidade e variedade de dados, mantendo a eficiência operacional e de custos" (LOPEZ, 2012).
Sendo assim, a pesquisa é importante para os gestores, pois apresentará resultados que alterarão sobre a importância e o uso de informações, e mesmo o comportamento dos tomadores de decisão. Esse processo pode sofrer alterações, sempre se atualizando com as novidades que o mercado apresenta, sempre acompanhando as oportunidades disponíveis para os gestores.

4 REFERENCIAL TEÓRICO
        
         Apesar de Big Data ser um assunto relativamente novo na área de tecnologia, devido ao fato de ser bastante promissor, já há vários trabalhos e pesquisas realizados em cima deste. Eles vão desde pesquisas sobre o tema até explicações teóricas e conceituais sobre o tema. Alguns desses tópicos serão apresentados a seguir neste trabalho.

4.1 BIG DATA X DATA WHAREHOUSE

            É muito comum as pessoas confundirem o conceito de Big Data e de Data Wharehouse, mas é importante frisar que os dois não são a mesma coisa.
            A ideia de Big Data é a tomada de decisão em tempo real sobre uma corrente continua de informações não estruturadas vindo de diversas fontes e descobrir algo útil em menor tempo e com maior precisão.
    Os Data Wharehouse oferecem acesso a dados para análise complexa, descoberta de conhecimento e tomada de decisão, Eles dão suporte a demandas de alto desempenho sobre os dados e informações de uma organização (ELMASRI; NAVATHE, 2011).
Bancos de dados transacionais, Data Wharehouses costumam apoiar a análise de série temporal e tendência, ambas exigindo mais dados históricos do que geralmente é mantido nos bancos de dados transacionais. Conforme Elmasri e Navathe (2011) os Data Wharehouses são bancos não voláteis ou seja as informações no Data Wharehouse mudam com muito menos frequência e podem ser consideradas não de tempo real com atualização periódica.
Fica claro no parágrafo acima que os bancos Data Wharehouse por mais seguros que seja ele precisa de muita informação assim como o Big Data porém com uma grande e importante diferença eles armazenam dados por períodos ficando difícil assim fazer por exemplo uma estimativa de quanto uma loja vai vender, sendo assim o Big Data da uma grande vantagem competitiva para a empresa.
Sabendo que o Big Data armazena informações e sua análise é quase em tempo real fica bem melhor para as organizações saberem quanto elas podem faturar em um determinado período.
    Mas com o Data Wharehouse também da para saber quanto uma organização vai faturar só que ele tem a desvantagem que ele precisa de mais informações históricas para te retornar um dado útil.
Um exemplo de aplicação Big Data foi na tomada de decisão de reeleição do presidente dos EUA, Barack Obama, ajudando a orientar voluntários, indicar as melhores formas de arrecadar fundos e apontar quem poderia ser convencido a apoiar a reeleição do presidente.
Pesquisa realizada por McAffe e Brynjolfsson diz que empresas que utilizam Big Data são 5% mais produtivas e 6% mais lucrativas que seus concorrentes (BRETERNITZ; SILVA, 2013).

4.2 ASPECTOS RELATIVOS AO PESSOAL

            Além de mudanças no processo de tomada de decisões propriamente dito, que exigirá mudanças no pessoal envolvido, devem-se considerar também os aspectos relativos ao pessoal que dará suporte aos tomadores de decisões (BRETERNITZ; SILVA, 2013). Esse pessoal, que vem sendo chamado “cientistas de dados”, precisa ter raciocínio lógico apurado, conhecimento profundo de estatística e software dessa área, modelagem, domínio de sistemas computacionais e conhecimento do negócio e do mercado em que atuará (DAVENPORT; BARTH; BEAN, 2012).
            Além disso, como pode ser visto no trabalho de Breternitz e Silva (2013), será necessária a capacidade de comunicar seus insights a um pessoal com uma formação não técnica. Profissionais com esse perfil são muito raros e sua formação demanda muito tempo, o que torna sua utilização cara. Esses profissionais, não são os mesmos que na atualidade são chamados de “Analistas de Business Intelligence”, especialmente pelo grau de sofisticação das ferramentas utilizadas e da formação necessária. Não havendo ainda formação específica para profissionais dessa área, tem sido comum a utilização de pessoas com formação e experiências diversas.

4.3 DECISÕES

Segundo Breternitz e Silva (2013), os desafios tecnológicos envolvidos na utilização de Big Data são muito grandes, um dos mais críticos está ligado à tomada de decisões; quando o volume de dados disponíveis é relativamente pequeno, de difícil obtenção e/ou não disponível em formato digital, é usual deixar que pessoas situadas em pontos elevados da hierarquia organizacional tomem decisões com base em sua experiência, o que fazem geralmente levando em conta padrões e relacionamentos que internalizaram ao longo de suas carreiras – isto é usualmente chamado “intuição”.  Assim, as pessoas estabelecem convicções em relação ao futuro, do que pode ou não funcionar corretamente, e estas convicções é que fazem as empresas planejarem.
Os autores Mauboussin (2012) e Brynjolfsson e McAfee (2012) recomendam o uso de uma abordagem evolutiva, inicialmente aplicando duas técnicas: a primeira consiste em habituar-se a questionar, quando dados estiverem disponíveis: "o que dizem os dados?", "de onde eles vêm?", “como foram analisados?", "qual o nível de confiança que temos no resultado dessas analises?" e outras similares - com os ocupantes de cargos mais elevados usualmente atuando dessa forma.
O pessoal subordinado deve passar a entender que o tema é importante e, eles mesmos, em suas esferas de atuação, poderão adotar essa forma de raciocinar e questionar. O segundo passo seria deixar claro que os dados podem fazer com que decisões sejam tomadas contrariando a intuição dos principais executivos - essa postura tem um efeito muito grande sobre o pessoal subordinado (BRETENITZ; SILVA, 2013).

4.4 MERCADO

O mercado do Big Data se mostra muito promissor. A Broadtec apresenta dados quantitativos e estatísticos sobre o Big Data que serão apresentados a seguir.
A perspectiva é de que a ferramenta movimente US$ 41,5 bilhões até 2018. Esse dado representa uma taxa de crescimento anual de 26,4% no período, uma expansão seis vezes maior à da indústria de TI como um todo – os dados foram retirados de uma pesquisa recente realizada pela IDC.
De acordo com o relatório, o sistema de infraestrutura irá continuar comandando uma grande parcela desse mercado, após deter 48,2% de market share este ano.  No entanto, o mercado de Big Data deve sofrer uma paralisação nos próximos anos devido à falta de profissionais especializados nessa área.
O IDC prevê que somente nos EUA haverá 181 mil postos de trabalho para profissionais especializados na área até 2018, porém o número ainda é insuficiente para a demanda que o mercado necessita. Ou seja, não haverá profissionais qualificados suficientes para preencher esses postos de trabalho.

4.5 PRIVACIDADE

Atualmente, a prática do Big Data tornou-se mais comum do que deveria. A intensa coleta de informações pessoais e compartilhamento destas com empresas e até mesmo governos sem o consentimento dos usuários pode representar inúmeros riscos à privacidade (Big Data e a questão da privacidade, 2013).
Segundo especialistas, informações pessoais como lista de contatos, localização e endereços de e-mail são constantemente  rastreados e analisados pela infraestrutura de nuvem que permite o armazenamento massivo de dados por parte das empresas. Apesar de algumas empresas de tecnologia serem transparentes em relação ao armazenamento de informações deste tipo, a maioria ainda engatinha em relação a divulgação da coleta e uso de dados (Big Data e a questão da privacidade, 2013).

Segundo o artigo “Big Data e a questão da privacidade” (2013), a Tecnologia da Informação entra em cena neste momento para redefinir as prioridades de programas de armazenamento de informações pessoais. Assim, é essencial que os desenvolvedores desempenhem papeis mais importantes na proteção da privacidade, criando ferramentas que permitem aos usuários visualizar, analisar e reconfigurar políticas de dados de empresas de acordo com suas necessidades e preferências.
De acordo com as opiniões de Taurion (2014), o Big Data, indiscutivelmente aumenta o risco de brechas na privacidade, mas a questão é se este risco é realmente preocupante ou não. Pode-se levar em conta a situação das câmeras de segurança. É sabido que elas estão por aí, mas as pessoas já estão acostumadas com elas. As pessoas voluntariamente colocam seus dados pessoais no Facebook ou expressam suas opiniões no Twitter. Sabe-se que o Google usa os argumentos de busca e vídeos que são vistos no YouTube para exibir propagandas que seus algoritmos achem mais adequadas aos interesses de cada indivíduo. Assim, o foco da discussão é se os conceitos, leis, regras e soluções que governaram a questão da privacidade até hoje ainda são válidos. Pode ser que se o problema mudou, as soluções que usadas não façam mais sentido.
O artigo “Os riscos do Big Data e a invasão de privacidade nos EUA” (2013) discute sobre os reais riscos de privacidade com o Big Data. As fotos compartilhadas em uma rede social, os e-mails trocados, as pesquisas feitas em buscadores por exemplo, geram dados sobre o perfil de cada usuário na Internet. Essas informações são captadas por diversas empresas, muitas vezes sem o real consentimento dos usuários. A área da saúde (testes clínicos, exames médicos, entre outros), Smart Grid e até mesmo a Cloud Computing se beneficiam desses dados, por exemplo. Porém, eles oferecem riscos de privacidade por trabalharem com informações que, na maioria dos casos, não são anônimas.
Taurion (2014) ainda complementa que provavelmente será que repensar como tratar dados e privacidade nos novos tempos do Big Data e cita que o cientista Alex Pentland, do MIT, propõe o que ele chama de “New deal” de dados, que seriam garantias práticas de que os dados necessários dos produtos públicos estarão disponíveis, mas ao mesmo tempo não afetariam a privacidade. Para ele a chave é tratar os dados pessoais como um bem, onde as pessoas teriam seus direitos assegurados sobre seus próprios dados. Ou seja, independente de quem coletar os dados sobre um indivíduo, eles pertencerão a este e poderão ser acessados quando o dono quiser. Os captadores de dados agiriam como bancos, gerenciando os dados em nome de seus clientes, como os bancos fazem com seu dinheiro. A certeza é de que estamos vivenciando uma sociedade cada vez mais conduzida e gerenciada por dados e os conceitos de privacidade, fluídos com o tempo, começam a ser rediscutidos.

5 CONSIDERAÇÕES FINAIS

O propósito principal deste trabalho foi de apresentar e analisar a frequência do uso da internet por meio de fontes de pesquisas, redes sociais, telefones celulares e sistemas convencionais, que deixam o seu rastro digital, fazendo com que isso se torne um banco de dados enorme, denominado Big Data. Também, com intuito de trazer conhecimentos relacionados ao tema proposto.
É fundamental ser do conhecimento dos gestores saber lidar com as características e novidades das informações de hoje, no contexto de Big Data: volume, variedade, velocidade, valor e veracidade. Para isso é necessário que eles estudem e passem a entender como essas novidades e características influenciam no processo decisório (BRETERNITZ; SILVA, 2013).

Através de pesquisas, foram determinadas que uma análise quando é bem feita, leva o conhecimento de padrões de comportamento, até então desconhecidas, e ajuda a prever tendências de consumo, que na maioria das vezes é um desafio muito grande para várias empresas, tornando-a menos competitiva.
Um ponto relevante para o nosso estudo, é a variedade de informações que são a consequência de um volume de dados tão grande que temos hoje. Atualmente, temos muitos dados em formatos estruturados, isto é, armazenados em bancos como PostgreSQL e Oracle, que são dados que contém uma organização para serem recuperados. Temos também os dados não estruturados, vindo de inúmeras fontes, podendo ser áudio, vídeo, imagem, documento, entre outros, dificultando a leitura dos dados por não ter todas as informações possíveis.

REFERÊNCIAS

Big Data e a questão da privacidade. Disponível em: <http://www.futurecom.com.br/blog/big-data-e-a-questao-da-privacidade/>. Publicado em: 18 de julho de 2013. Acesso em: 21 de junho de 2015.
BRETERNITZ, V. J.; SILVA, L. A. Big data: um novo conceito gerando oportunidade e desafios. Revista Eletrônica de Tecnologia e Cultura, Edição 13ª, outubro de 2013.
BROADTEC. Mercado de Big Data: carência de profissionais qualificados. Disponível em: <http://www.broadtec.com.br/mercado-de-big-data-carencia-de-profissionais-qualificados/>. Acesso em: 21 de junho de 2015.
DAVENPORT, T. H; BARTH, P; BEAN, R. How Big Data is different. MIT Sloan Management Review. Vol 54, nº 1, 2012.
ELMASRI, R.; NAVATHE, S. B. Sistemas de Bancos de Dados. Pearson, 6ª edição, 2011.
HAMMOND, Kristian. The Value of Big Data Isn't the Data. Blog da Harvard Business Review, maio 2013. Disponível em: <http://blogs.hbr.org/cs/2013/05/the_value_of_big_data_isnt_the.html>. Acesso em: 21 de junho de 2015.
HENRIQUES, D. A.; COSTA, H. R. Big Data como utilizar a extraordinária quantidade de informações coletadas por novas tecnologias para obter vantagens competitivas. 2013. Disponível em: <http://revistapensar.com.br/tecnologia/pasta_upload/artigos/a72.pdf> Acesso em:  20 de junho de 2015.
ISACA. Privacidade & Big Data. 2013. Disponível em: <http://www.isaca.org/Knowledge-Center/Research/Documents/Privacy-and-Big-Data_whp_Por_0913.pdf?regnum=263616>. Acesso em: 20 de junho de 2015.
LOPEZ, Jorge. Best Practices for Turning Big Data into Big Insights. Business Intelligence Journal, v. 17, n. 4, 2012.
MAUBOUSSIN, M. J. The True Measures of Success. Harvard Business Review, edição de outubro de 2012.
MCAFEE, A; BRYNJOLFSSON, E. Big Data: The Management Revolution. Harvard Business Review, edição de outubro de 2012.
Os riscos do Big Data e a invasão de privacidade nos EUA. Disponível em: <http://blogbrasil.comstor.com/bid/305729/Os-riscos-do-Big-Data-e-a-invas-o-de-privacidade-nos-EUA>. Publicado em 18 de junho de 2013. Acesso em: 21 de junho de 2013.
Redação da CanalTech. Big Data: os cinco Vs que todo mundo deveria saber. 18 de março de 2013. Disponível em: <http://corporate.canaltech.com.br/dica/big-data/Big-Data-os-cinco-Vs-que-todo-mundo-deveria-saber/>. Acesso em: 21 de junho de 2015.
TAURION, C. Privacidade em tempos de Big Data. Disponível em: <http://cio.com.br/opiniao/2014/01/28/privacidade-em-tempos-de-big-data/>. Publicado em: 28 de janeiro de 2014. Acesso em: 21 de junho de 2015.



[1] Aluna da Universidade do Estado de Minas Gerais - Campus Frutal. Bacharelanda em Sistemas de Informação - UEMG - Universidade do Estado de Minas Gerais - Campus Frutal. Email: bruna.cortes@aol.com

[2] Aluno da Universidade do Estado de Minas Gerais - Campus Frutal. Bacharelando em Sistemas de Informação - UEMG - Universidade do Estado de Minas Gerais - Campus Frutal. Email: diegorecargasmix@hotmail.com

[3] Aluno da Universidade do Estado de Minas Gerais - Campus Frutal. Bacharelando em Sistemas de Informação - UEMG - Universidade do Estado de Minas Gerais - Campus Frutal. Email: r_afaelr@hotmail.com

[4] Aluno da Universidade do Estado de Minas Gerais - Campus Frutal. Bacharelando em Sistemas de Informação - UEMG - Universidade do Estado de Minas Gerais - Campus Frutal. Email: sthevemdk@hotmail.com

Nenhum comentário:

Postar um comentário