Aprendizado de máquina
Atualmente, ouvimos falar muito de Big Data, Data Science, Inteligência Artificial e Machine Learning. Esses assuntos tem aparecido cada vez mais em filmes, palestras e principalmente dentro de empresas de tecnologia.
Mas afinal, o que são todas essas coisas? Para que servem?
Big Data é um termo amplamente usado na atualidade para nomear conjuntos de dados muito grandes ou complexos, que os aplicativos de processamento de dados tradicionais não conseguem lidar devido ao grande volume, variedade e velocidade que são gerados.
Porém, uma mina de ouro se esconde nesses dados.
Estamos criando mais e mais informação a cada dia. Em 2013 a SINTEF estimou que 90% da informação do mundo havia sido gerada nos últimos 2 anos e essa taxa acelerada de criação de dados tem dobrado a cada 1,5 anos.
Mas como processar toda essa informação e extrair tal conhecimento? É aí que entra a Ciência de Dados.
Data Science ou Ciência de Dados é a área de estudo da extração de conhecimento desse mar de dados. É o campo de atuação do Data Scientist.
Data Scientist ou Cientista de Dados é o profissional que navega por esse mar de dados a fim de encontrar padrões e descobrir novas oportunidades de produtos ou negócios. Toda essa análise é feita com uso de ferramentas matemáticas, muita estatística e uma infinidade de técnicas e algoritmos de aprendizado de máquina. Devido à quantidade cada vez maior de dados gerados pelas empresas atualmente, tornou-se um profissional raro e um dos mais procurados do mercado.
Esses são alguns dos muitos exemplos de como essa área está em crescimento nesse momento.
Inteligência Artificial é um ramo da ciência da computação que se propõe a elaborar algoritmos que simulem a capacidade humana de raciocinar, perceber, tomar decisões e resolver problemas, enfim, a capacidade de ser inteligente. Existem dois tipos de raciocínios estudados por ela: o indutivo e o dedutivo.
Machine Learning ou Aprendizado de Máquina é um subcampo da inteligência artificial focado no raciocínio indutivo. Seu objetivo é o desenvolvimento de algoritmos e técnicas que permitam ao computador aprender determinada tarefa através da extração de regras e padrões de grandes conjuntos de dados.
O Gartner, que é um dos maiores especialistas em consultoria na área de tecnologia, vem citando essa área entre as 10 tecnologias mais estratégicas do ano por muitos anos:
- 2016: Advanced Machine Learning
- 2015: Smart Machines
- 2014: Smart Machines
- 2013: Strategic Big Data
- 2012: Big Data
Aplicações
Muito legal, mas para que serve tudo isso? Onde usamos?
As aplicações são inúmeras e muitas dessas aplicações já estão presentes no nosso dia a dia:
-
Imagine que você tem um e-commerce e quer enviar propagandas mais assertivas para seus clientes. Você poderia achar clientes com os mesmos interesses, provavelmente um produto que um deles tenha comprado seria do interesse do outro. Mas como cruzar dados de uma base de dezenas de milhares de clientes e achar esses padrões? Seria impossível para uma pessoa e até mesmo com algoritmos tradicionais seria uma tarefa custosa e demorada. Usando Machine Learning para criar um sistema de recomendação você conseguiria fazer isso, sites como Amazon, Netflix e muitos outros já usam isso, alcançando em alguns casos mais de 30% no aumento do faturamento devido ao fato de recomendar a coisa certa para o usuário;
-
Podemos analisar o padrão comportamental de um usuário de cartão de crédito, cruzar com dados de outros usuários e quando algo fugir do padrão pode se tomar precauções extras para prevenir uma fraude. Machine Learning já é usado por anos no combate à fraude e com um bom percentual de sucesso. A Visa diz ter impedido bilhões de dólares em fraudes com o uso de Big Data e o PayPal também diz ter reduzido bastante à fraude com Machine Learning. Mais recentemente, pesquisadores do MIT criaram um sistema capaz de detectar ciberataques com 85% de precisão;
-
No mercado financeiro mais de 50% das operações com ações já são feitas por robôs com uso de inteligência artificial. Utilizando da mesma técnica, bancos são capazes de fazer análise de credito de um cliente e análise da confiabilidade de uma transação de maneira muito mais eficiente;
-
Temos o que a IBM chama de computação cognitiva, em 2011 ela apresentou o supercomputador Watson, que se destacou ao vencer humanos em um programa de auditório, atualmente tem funcionado como assistente médico ao ajudar no combate ao câncer, além de ser capaz de analisar, entender e aprender com grandes conjuntos de dados de uma empresa e gerar informações úteis que podem levar a novos negócios. Desde que foi lançado, Watson já levou à criação de 500 novos negócios e hoje é um dos focos principais da IBM;
-
Temos também computadores invencíveis no Xadrez e até mesmo no Go, um jogo chinês que especialistas duvidavam que uma máquina fosse capaz de dominar em um futuro próximo;
-
E veículos completamente autônomos como os desenvolvidos pelo Google, Apple, Tesla, Volkswagen, Mercedes-Benz e Nissan. Temos casos de veículos que dirigiram milhares de quilômetros por cidades populosas e estradas totalmente controlado por um software de inteligência artificial.
As aplicações são inúmeras para inteligência artificial, até mesmo em campanhas políticas e para prever o resultado da votação de impeachment já foi usada e com uma taxa de acerto muito boa.
É uma área com potencial enorme de crescimento e acredito que atualmente as empresas que não utilizam esse tipo de tecnologia já estão saindo atrás no mercado.
O objetivo desse artigo foi introduzir os conceitos de Data Science e Machine Learning e o que somos capazes de fazer com essas tecnologias, nos próximos artigos irei mostrar como iniciar nessa área e até mesmo como participar de algumas competições.
Voltar para página inicial: Carlos Baia