Nó Extrator de CPF/CNPJ
O nó Extrator de CPF é uma ferramenta especializada para identificar, validar e extrair números de CPF (Pessoas Físicas) e CNPJ (Pessoas Jurídicas) dentro de textos processados.
Diferente de uma busca simples por texto, este nó aplica algoritmos de validação (dígitos verificadores) e lógica de detecção de conflitos.
Pré-requisitos
Este nó não lê arquivos diretamente. Ele precisa receber o conteúdo de texto que já foi extraído de um documento. Portanto, o fluxo padrão é:
- Entrada (Recebe o arquivo)
- Extrator de Arquivos (Converte PDF/Imagem em texto)
- Extrator de CPF (Lê o texto e busca os documentos)
Configuração
A configuração é simples e direta, exigindo apenas a conexão com a fonte dos dados.

Entrada
Você deve selecionar a variável que contém o conteúdo textual dos arquivos.
- Campo: "Entrada".
- O que selecionar: Busque pela saída do nó anterior de extração, geralmente
{{ extrator_de_arquivos.contents }}.
O que ele detecta?
O nó é capaz de identificar padrões formatados e não formatados:
- CPF:
123.456.789-00ou12345678900 - CNPJ:
12.345.678/0001-00ou12345678000100
Detecção de Conflitos
Uma funcionalidade poderosa deste nó é o alerta de Conflito. Ele marcará um documento como conflitante se:
- Encontrar múltiplos CPFs diferentes em um documento que deveria ser pessoal.
- Encontrar formatações inconsistentes.
Isso é extremamente útil para triagem automática de documentos.
Variáveis de Saída
O nó gera uma lista de resultados (results) contendo os dados encontrados por arquivo.
Exemplo de Saída (JSON)
[
{
"filename": "contrato_joao.pdf",
"cpfs": ["123.456.789-00"],
"cnpjs": [],
"conflict": false
},
{
"filename": "documento_estranho.pdf",
"cpfs": ["111.222.333-44", "999.888.777-66"],
"conflict": true,
"conflict_list": ["Múltiplos CPFs encontrados"]
}
]