• Michel

Vendas cruzadas (Market Basket Analysis) no RapidMiner

Atualizado: 19 de Jan de 2019

Market basket analysis é o processo de análise de dados a nível de transação com o objetivo de gerar valor para o negócio. A este nível de detalhe, a informação pode ser muito útil, pois revela como cada um dos clientes fez compras na loja. Os dados revelam não só a quantidade de itens que foram comprados numa cesta particular, mas como os itens comprados estão associados.





A maioria dos varejistas consolida e agrega seus dados para entender o comportamento básico do negócio: o que estão vendendo, quantas unidades e o valor das vendas. No entanto, poucos são os que analisam as informações no seu nível mais baixo de granularidade: a análise da cesta de compras (Market basket analysis). A principal razão talvez seja a noção preconcebida que olhar para dados a este nível de granularidade é caro e tem limitado valor comercial.

Market basket analysis é o processo de análise de dados a nível de transação com o objetivo de gerar valor para o negócio. A este nível de detalhe, a informação pode ser muito útil, pois revela como cada um dos clientes fez compras na loja. Os dados revelam não só a quantidade de itens que foram comprados numa cesta particular, mas como os itens comprados estão associados. Por sua vez, esse recurso permite análises avançadas tais como:

· Afinidade entre itens: define a probabilidade de dois (ou mais) itens serem comprados juntos

· Itens geradores de vendas: permite a identificação dos itens que sempre precisam estar nas prateleiras

· Classificação da compra: analisa o conteúdo da cesta e classifica a compra em categorias como compras semanais, noturnas, ocasiões especiais, etc.


Associações possíveis numa compra

Existem afinidades naturais entre produtos. Por exemplo, uma pessoa que compra carne para hambúrguer possivelmente comprará pães de hambúrguer, bem como ketchup, mostarda, tomate e outros itens que compõem um hambúrguer. Porém existem algumas afinidades que não são óbvias. O exemplo clássico é a compra de pasta de dentes associada a atum. Parece que as pessoas que comem atum são mais propensas a escovar os dentes logo após terminar sua refeição.

O valor real de análise de afinidades ou regras de associação é encontrar conexões aparentemente não-intuitivas entre itens.


90% das pessoas que compram A também compram B

A noção de afinidade entre produtos é fundamental para planejar adequadamente promoções, por exemplo reduzindo o preço de alguns itens associados a outros itens.

As regras de associação têm como premissa básica encontrar elementos que implicam na presença de outros elementos em uma mesma transação, ou seja, encontrar relacionamentos ou padrões frequentes entre conjuntos de dados.

Na tabela abaixo temos cinco transações, sendo os itens os objetos entre os quais identificamos associações, leite, pão, manteiga e cerveja.

As regras são declarações do tipo


{farinha, açúcar} ⇒ {ovos}

Ou seja, se você tem os itens à esquerda então é provável que estará também interessado

no item á direita.

O resultado de uma análise de cesta de mercado é um conjunto de regras que podemos explorar para tomar decisões de negócios relacionadas à preços ou posicionamento físico. Para isso é usada uma terminologia específica.

O suporte de um item (ou conjunto de itens) é a fração do total de transações que contêm esse item (ou itens). Por exemplo, na tabela temos:

Suporte leite = 2/5 = 0,4

Suporte pão = 4/5 = 0,8

Suporte manteiga = 2/5 = 0,4

Suporte cerveja = 1/5 = 0,2


Os produtos {leite} e {pão} aparecem juntos nas transações 1 e 4, desta maneira, o suporte da regra {leite} e {pão} é: 2 / 5= 0,4

Observe agora que na base de dados, existem duas transações que contêm o produto {manteiga} e que apenas em uma delas foi comprado {leite} e {pão}. Então a confiança da regra

{leite} e {pão} ==> manteiga

é 50% ou 0,5.


Em geral, é bom identificar as regras de associação que têm um alto suporte pois estas serão aplicáveis a um grande número de transações. Para uma padaria é provável que as regras envolvam produtos como pão e leite. Já para um varejista de cartuchos de impressora provavelmente não haverá produtos com alto suporte porque cada cliente compra apenas os cartuchos que são específicos para sua própria impressora.


Na figura acima são mostrados itens associados, i.e., que ocorrem juntos nas transações. A força das relações (confiança) é indicada pela espessura da linha. A frequência (suporte) do item é indicada pelo tamanho do círculo que representa o produto.


Aplicando na Prática

Usando o RapidMiner analisa-se o comportamento das vendas a fim de identificar os conjuntos de produtos frequentemente comprados juntos.

No RapidMiner, regras de associação são extraídas usando dois operadores em sequência. O primeiro operador, chamado de FP Growth (Frequent Pattern Growth) é necessário para gerar conjuntos de itens frequentes. Em seguida, o segundo operador, Criar Regras de Associação, produz as regras IF-THEN baseadas nos requisitos de confiança das regras. Mas antes podem ser necessárias algumas etapas de pré-processamento para selecionar os atributos que você quer e mais importante, para converter os dados de entrada em forma binomial (verdadeiro/falso), formato que é exigido pelo operador FP Growth.

Incorporamos este modelo em um painel de controle interativo (dashboard) como abaixo, que será operado pela divisão de marketing do cliente. Com isso aprimoramo-se a forma como as campanhas de promoção são construídos e estimula-se as taxas de resposta em ações de marketing.



Quando o processo acima é executado, o RapidMiner irá gerar saídas com a exibição de texto que irá mostrar as regras como estas abaixo:



3 Dimensões

Inteligência Artificial nas Empresas

Al. das Papoulas, 147 - Santana de Parnaíba - Alphaville, SP 06539-180 - (11) 4153 6004  - (11) 9 9795 9765

michel@3dimensoes.com.br