Nó Extrator de CPF/CNPJ

O nó Extrator de CPF é uma ferramenta especializada para identificar, validar e extrair números de CPF (Pessoas Físicas) e CNPJ (Pessoas Jurídicas) dentro de textos processados.

Diferente de uma busca simples por texto, este nó aplica algoritmos de validação (dígitos verificadores) e lógica de detecção de conflitos.

Nó Extrator de CPF no Canvas

Pré-requisitos

Este nó não lê arquivos diretamente. Ele precisa receber o conteúdo de texto que já foi extraído de um documento. Portanto, o fluxo padrão é:

Entrada (Recebe o arquivo)
Extrator de Arquivos (Converte PDF/Imagem em texto)
Extrator de CPF (Lê o texto e busca os documentos)

Configuração

A configuração é simples e direta, exigindo apenas a conexão com a fonte dos dados.

Painel de Configuração Extrator de CPF

Entrada

Você deve selecionar a variável que contém o conteúdo textual dos arquivos.

Campo: "Entrada".
O que selecionar: Busque pela saída do nó anterior de extração, geralmente {{ extrator_de_arquivos.contents }}.

O que ele detecta?

O nó é capaz de identificar padrões formatados e não formatados:

CPF: 123.456.789-00 ou 12345678900
CNPJ: 12.345.678/0001-00 ou 12345678000100

Detecção de Conflitos

Uma funcionalidade poderosa deste nó é o alerta de Conflito. Ele marcará um documento como conflitante se:

Encontrar múltiplos CPFs diferentes em um documento que deveria ser pessoal.
Encontrar formatações inconsistentes.

Isso é extremamente útil para triagem automática de documentos.

Variáveis de Saída

O nó gera uma lista de resultados (results) contendo os dados encontrados por arquivo.

Exemplo de Saída (JSON)

[
  {
    "filename": "contrato_joao.pdf",
    "cpfs": ["123.456.789-00"],
    "cnpjs": [],
    "conflict": false
  },
  {
    "filename": "documento_estranho.pdf",
    "cpfs": ["111.222.333-44", "999.888.777-66"],
    "conflict": true,
    "conflict_list": ["Múltiplos CPFs encontrados"]
  }
]

Pré-requisitos​

Configuração​

Entrada​

O que ele detecta?​

Detecção de Conflitos​

Variáveis de Saída​

Exemplo de Saída (JSON)​