Pular para o conteúdo principal

Nó Extrator de CPF/CNPJ

O nó Extrator de CPF é uma ferramenta especializada para identificar, validar e extrair números de CPF (Pessoas Físicas) e CNPJ (Pessoas Jurídicas) dentro de textos processados.

Diferente de uma busca simples por texto, este nó aplica algoritmos de validação (dígitos verificadores) e lógica de detecção de conflitos.

Nó Extrator de CPF no Canvas

Pré-requisitos

Este nó não lê arquivos diretamente. Ele precisa receber o conteúdo de texto que já foi extraído de um documento. Portanto, o fluxo padrão é:

  1. Entrada (Recebe o arquivo)
  2. Extrator de Arquivos (Converte PDF/Imagem em texto)
  3. Extrator de CPF (Lê o texto e busca os documentos)

Configuração

A configuração é simples e direta, exigindo apenas a conexão com a fonte dos dados.

Painel de Configuração Extrator de CPF

Entrada

Você deve selecionar a variável que contém o conteúdo textual dos arquivos.

  • Campo: "Entrada".
  • O que selecionar: Busque pela saída do nó anterior de extração, geralmente {{ extrator_de_arquivos.contents }}.

O que ele detecta?

O nó é capaz de identificar padrões formatados e não formatados:

  • CPF: 123.456.789-00 ou 12345678900
  • CNPJ: 12.345.678/0001-00 ou 12345678000100

Detecção de Conflitos

Uma funcionalidade poderosa deste nó é o alerta de Conflito. Ele marcará um documento como conflitante se:

  1. Encontrar múltiplos CPFs diferentes em um documento que deveria ser pessoal.
  2. Encontrar formatações inconsistentes.

Isso é extremamente útil para triagem automática de documentos.


Variáveis de Saída

O nó gera uma lista de resultados (results) contendo os dados encontrados por arquivo.

Exemplo de Saída (JSON)

[
{
"filename": "contrato_joao.pdf",
"cpfs": ["123.456.789-00"],
"cnpjs": [],
"conflict": false
},
{
"filename": "documento_estranho.pdf",
"cpfs": ["111.222.333-44", "999.888.777-66"],
"conflict": true,
"conflict_list": ["Múltiplos CPFs encontrados"]
}
]