Como Importar PDF no Excel com Power Query

Como importar PDF no Excel com Power Query passo-a-passo com exemplo e download gratuito do arquivo.

Como importar arquivo PDF no Excel com Power Query?

Veja neste artigo, como importar arquivo PDF, utilizando o Power Query no Microsoft Excel.

É possível trabalhar com uma tabela de dados de arquivo PDF no Excel?

Sim e não, confuso, mas muita calma nessa hora.

Se você possui o Office 365, a resposta é SIM, caso contrário, lamento em dizer, mas você NÃO conseguirá importar uma tabela diretamente de arquivo pdf.

Mas, quais são essas possibilidades com Office 365?

Sabemos que existe o suplemento Power Query no Excel, desde sua versão 2010, porém, apenas na versão disponibilizada no Office 365, podemos importar e tratar dados de arquivos salvos na extensão .pdf.

Porém, ligue o alerta, muitos sistemas possibilitam ao usuário exportar relatórios em diversas extensões, como: .csv, .xls, .xlsx, .pdf, entre outras.

O Excel consegue importar PDF, então vou utilizar sempre esta extensão? Não.

Cuide para a estrutura dos dados dispostos no arquivo PDF, veja se o mesmo apresenta um padrão tabular, afinal, você quer e precisa facilitar sua vida e não arrumar mais um problema, correto?

Tá ok, mas como importamos o arquivo?

Antes de importar, lembre-se de verificar e conhecer a estrutura do arquivo. No exemplo iremos trabalhar com uma tabela, apresentada em um arquivo salvo na extensão .pdf, contendo apenas 1 página.

Siga as seguintes etapas:

  1. Abra uma nova pasta de trabalho do Excel;
  2. Vá até a guia DADOS;
  3. No grupo Obter e Transformar Dados, selecione Obter Dados;
Como importar pdf no excel com power query 1
  • Na lista que irá surgir, selecione De Arquivo -> De PDF
Como importar pdf no excel com power query 2
  • Irá surgir a Janela de Importação do Arquivo, localize a pasta onde o arquivo está salvo e o selecione, clique em Importar;
Como importar pdf no excel com power query 3
  • Surgirá a janela Navegador, selecione sempre o objeto Tabela e clique sempre em Transformar Dados;
Como importar pdf no excel com power query 4
  • Muito bem, agora você está no Editor do Power Query, veja que legal, automaticamente etapas foram criadas, MAS LEGAL, NÃO SIGNIFICA QUE ESTEJA CERTO.
    • Repare que duas colunas foram criadas para o nome, na imagem você vê a Column3, esta coluna tem para si partes do sobrenome dos colaboradores (precisaremos realizar a mescla destas colunas);
    • Repare também no cabeçalho da coluna de data de nascimento, ela reteve o nome das colunas ao lado em um único registro (precisaremos renomear estas colunas).
Como importar pdf no excel com power query 5
  • Vamos começar os tratamentos:
    • Exclua a etapa Tipo Alterado;
    • Com a tecla Control (Ctrl) pressionada, clique sobre a coluna ID,Colaborador e Column3 (nesta ordem), com botão direito do Mouse, selecione a opção Mesclar Colunas;
    • Surgirá a janela Mesclar Colunas, no campo de separador selecione “espaço”; clique em ok;
Como importar pdf no excel com power query 6
  • Perceba que a coluna Mesclada traz agora o ID e o Nome, iremos dividir o conteúdo desta coluna de dígito para não dígito;
Como importar pdf no excel com power query 7
  • Agora esta nova coluna está parcialmente correta, note que foram inseridos espaços a mais no início e fim dos nomes onde na Column3 havia o registro null;
    • Para solucionar este problema, selecione a coluna Mesclado.2, clique com botão direito do mouse, selecione Transformar -> Cortar, deste modo espaços em excesso a esquerda ou direita serão removidos;
Como importar pdf no excel com power query 8
  • Agora iremos renomear as colunas Mesclado.1 para ID, Mesclado.2 para Nome, e as colunas de Datas: a primeira coluna será Data_Nascimento, em seguida Data_Admissão e por fim Data_Demissão, para isto dê um duplo clique sobre os cabeçalhos e insira as informações listadas.
Como importar pdf no excel com power query 9
  • Por fim, iremos alterar o Tipo de Dado das colunas;
    • Selecione as colunas de Data pressionando o Ctrl, botão direito do mouse, Alterar Tipo de Dados -> Data
Como importar pdf no excel com power query 10
  • Na guia Página Inicial, no grupo Fechar, selecione fechar e carregar para;
    • Surgirá a janela de opções Importar Dados, selecione o que desejar: Tabela, tabela Dinâmica, Gráfico Dinâmico ou Apenas Conexão); Neste momento você ainda pode adicionar ao modelo de dados (Power Pivot), onde o horizonte de análises se expande, podendo utilizar medidas DAX e criar relacionamento entre Tabelas.

Deste modo, encerramos a importação e tratamento de um arquivo PDF com página única e tabela estruturada.

Se o pdf tiver mais de uma página?

O processo é o mesmo até a etapa nº6 (Navegador), aqui começa o ponto de diferença, ao invés de selecionar as tabelas, você irá clicar sobre a pasta amarela.

Ao entrar no editor do Power Query, você verá algumas colunas, logo, irá até a coluna Kind, procure o item Table em alguma das linhas, clique com botão direito do mouse, em Filtro de Texto, marque a opção “Igual a”.

Agora, selecione a coluna Data, clique com botão direito e selecione a opção de Remover outras colunas, deste modo, a única coluna que será mantida será a coluna selecionada.

Com a coluna Data, você deverá clicar no objeto de expansão (seta para esquerda e direita).

Após clicar no botão de expansão, desmarque a opção de usar o nome da coluna como prefixo, clique em ok.

Agora, deveremos promover a primeira linha como cabeçalho.

Note que na coluna ID, alguns registros aparecem com os caracteres “##”, precisamos neste caso, substituir estes caracteres por 0 (zero), para realizarmos as etapas seguintes da maneira correta e ao fim, iremos remover esta coluna ID, pois não será necessário para este exemplo.

Para substituir estes caracteres “##” por 0, selecione a coluna, em Página Inicial vá até o grupo Trasnformar e selecione o comando Substituir Valores.

Surgirá a caixa de diálogo, insira o caractere a ser procurado (##), no campo abaixo insira o valor 0, clique em OK.

Por fim, você deverá replicar as etapas que foram feitas com o arquivo de PDF com página única, tratar o erro das colunas de nomes e renomear as colunas de datas.

Deste modo, você terá seu arquivo pdf multi-páginas consolidado.

Finalizando os tratamentos, clique em Fechar e carregar Para e selecione o destino final da sua consulta.

Espero ter ajudado com mais este artigo, bons estudos.

Download Planilha Exemplo Importar PDF no Excel com Power Query

Clique no botão abaixo para realizar o  download do arquivo de exemplo:

Baixe a planilha


Thiago da Silva Romeiro

Pai, marido, professor e consultor de Excel.

Excel não precisa ser complicado

Assine nossa newsletter e receba dicas práticas para dominar o excel