• Michel

O que é Machine Learning

Atualizado: 8 de Jan de 2019

Uma breve introdução para quem quer saber do que se trata.

Machine Learning e Inteligencia Artificial


Inteligência artificial é a inteligência demonstrada por máquinas, em contraste com a inteligência natural exibida por seres humanos e outros animais. O termo "inteligência artificial" é quando uma máquina imita funções "cognitivas" da mente humana tais como "aprendizagem" e "resolução de problemas".

A inteligência artificial nasceu na década de 1950, quando um punhado de pioneiros da

campo nascente de ciência da computação começou a perguntar se os computadores poderiam ser feitos para pensar — uma pergunta cujas ramificações ainda estamos explorando hoje. Uma definição concisa do campo seria o seguinte: o esforço para automatizar tarefas intelectuais normalmente executadas por seres humanos. Como tal, a IA é um campo geral que engloba Machine Learning, e outros campos como mostrado na figura abaixo.

Por um tempo bastante longo, muitos especialistas acreditavam que a inteligência artificial de nível humano poderia ser alcançada por um conjunto suficientemente grande de regras explícitas que seriam incluídas em um gigantesco programa de computador

Essa abordagem é conhecida como ia simbólica, e foi o paradigma dominante em IA da década de 1950 até o final dos anos 1980. Alcançou sua popularidade máxima durante o período boom de sistemas da década de 1980.

Embora a IA simbólica tenha se mostrado adequada para resolver problemas lógicos bem definidos, como jogar xadrez, acabou sendo inviável descobrir regras explícitas para resolver mais problemas mais complexos como como classificação de imagens, reconhecimento de fala e tradução.

Uma nova abordagem surgiu para tomar o lugar da AI simbólica: Machine Learning.


Na inteligência de uma maneira geral, o raciocínio pode ser dividido em dois tipos - o indutivo e o dedutivo. Os raciocínios dedutivos se caracterizam por apresentar conclusões que devem, necessariamente, ser verdadeiras caso todas as premissas sejam verdadeiras e se o raciocínio respeitar uma forma lógica válida. Na indução, o raciocínio, após considerar um número suficiente de casos particulares, conclui uma verdade geral. A indução, ao contrário da dedução, parte de dados particulares da experiência.

Machine Learning ou Aprendizado de Máquina cai no segundo caso.

A figura a seguir mostra um espectro de ciências que são consideradas como áreas da IA.


Machine Learning, Estatística, Ciência de Dados e Mineração de Dados


O aprendizado de máquina e a estatística são campos intimamente relacionados. De acordo com Michael I. Jordam, as ideias do aprendizado de máquina, dos princípios metodológicos às ferramentas teóricas, tem uma longa pré-história na estatística. Ele também sugeriu o termo Ciência de Dados como um substituto para chamar o campo como um todo.

Leo Breiman distinguiu dois paradigmas da modelagem estatística: modelo de dados e modelo algorítmico, onde "modelo algorítmico" significa mais ou menos os algoritmos do aprendizado de máquina como, por exemplo, árvores de decisão.

Alguns estatísticos tem adotado métodos do aprendizado de máquinas, levando ao campo combinado que eles chamam de statistical learning.

O aprendizado de máquina e a mineração de dados com frequência fazem uso dos mesmos métodos e se sobrepõe significativamente, mas enquanto o aprendizado de máquina foca em fazer previsões, baseado em propriedades conhecidas aprendidas pelos dados de treinamento, a mineração de dados foca em descobrir as propriedades (previamente) desconhecidas nos dados.

Problemas típicos para Machine Learning

Os dois problemas mais comuns em ML são os de Regressão e Classificação. Vejamos um exemplo de cada um deles.

Vamos supor que queremos comprar um apartamento de 150 mt2, e que desejamos saber seu valor aproximado, independentemente de quanto o vendedor esteja pedindo.

Primeiramente podemos fazer um gráfico de preços versus a área dos apartamentos similares como a seguir.



Usando uma modelo linear, podemos aproximar todos estes pontos por uma reta, como abaixo,


Obtemos um valor R$ 780 mil.

Mas também podemos aproximar estes pontos por uma curva quadrática,


Neste caso obtemos R$ 810 mil

O que fizemos, foi fornecer respostas corretas (reais) para treinar um modelo que “aprendeu” a determinar um resultado baseado em seu conhecimento prévio.



Mas como escolher entre os dois casos?

A resposta é: escolhemos o modelo que resulta no menor erro ao comparar os resultados conhecidos com o resultado do modelo.


O erro é calculado como a soma dos erros que o modelo fez em todos os pontos de treinamento.

O que vimos foi um problema típico de Regressão.

Você poderá dizer que não precisamos de ML para chegar a esta conclusão, pois basta interpolar alguns valores na reta ou na curva e teremos o mesmo resultado. E terá razão. Acontece que em geral não queremos usar apenas a área de um apartamento para definir seu preço. Na verdade, são dezenas e as vezes centenas de variáveis como, localização, garagem, andar, vista, tipo do piso, etc., que são consideradas na prática. E isto você não poderá interpolar pelos processos manuais.

Vejamos agora um segundo exemplo.

Queremos determinar se um tumor é maligno ou benigno a partir do seu tamanho. Nesta caso temos um problema de classificar “sim ou não”, isto é, maligno ou não, mostrado no gráfico abaixo.


Ou seja, temos um problema de Classificação.

Observamos que apenas o tamanho do tumor não nos dá uma boa classificação, então adicionamos a idade do paciente.


Podemos traçar uma linha sinuosa dividindo os dois grupos.


Isto nos dá uma separação quase perfeita dos dois grupos.

Mais uma vez notamos que para analisar 2 ou 3 atributos, o olho humano é suficiente, porém podem existir muitas outras características a considerar como a espessura, uniformidade da célula, doenças pré-existentes, etc.. Os casos reais geralmente abrangem dezenas ou centenas de características, o que torna difícil a análise a olho nu e exigem a análise de um radiologista.

Nos dois exemplos o modelo de ML de uma certa forma usou recursos similares a inteligência humana para tomar decisões, e substituiu atividades normalmente praticadas por humanos. É importante salientar que, embora a as análises feitas pelos programas de ML sejam muito sofisticadas e rápidas, a avaliação final, principalmente em casos sensíveis, como diagnósticos de doenças, são executadas por humanos.

Como o Machine Learning é diferente da programação tradicional


Um programa de computador típico possui três etapas principais: entrada, processamento e saída. Então programação convencional e programação de Machine Learning podem ser comparadas em termos dessas três etapas.

O paradigma da programação tradicional é descrito no diagrama abaixo, em que as entradas são as observações e as saídas são alguma forma de processamento em cima destas observações.



Em ML as entradas também são as observações, porém são acrescidas das saídas já observadas, e o processamento trata de gerar um modelo que associa entradas e saídas de tal forma forma que uma nova entrada co saída desconhecida possa ser prevista pelo modelo.


Machine Learning é o processo de aprender com os dados gerando um modelo matemático, e em seguida, ser capaz de fazer previsões quando dados novos são introduzidos. Assim, temos uma máquina treinada para digerir grande quantidade de dados, processados através de algoritmos que lhe dão a capacidade de aprender a executar uma tarefa.

Para exemplificar, vamos supor que queremos identificar um gato.

Usando a programação tradicional um gato é identificado pelas suas características pré-estabelecidas, por exemplo, 2 olhos, 4 pernas,1 rabo, etc. . Com estas características o programa consegue dizer que temos um gato e não um ser humano.


Em ML para identificar um gato, primeiro entramos com centenas de imagens de gatos - o set de treinamento - em seguida um modelo é gerado com as principais características comuns a todos estas entradas, de tal forma que ao entrarmos com uma imagem qualquer, digamos um cão, o modelo verificará que não se trata de um gato.


Segue daí a definição de ML de Arthur Samuel:

o campo de estudo que dá aos computadores a habilidade de aprender sem serem explicitamente programados“


3 Dimensões

Inteligência Artificial nas Empresas

Al. das Papoulas, 147 - Santana de Parnaíba - Alphaville, SP 06539-180 - (11) 4153 6004  - (11) 9 9795 9765

michel@3dimensoes.com.br