Diretivas de linha de comando do Wrangler

Esta página descreve as diretivas que você pode usar no Wrangler.

No modo avançado do Wrangler (a CLI do Wrangler), é possível adicionar diretivas e funções a um roteiro. Para mais informações, consulte Diretivas da CLI do Wrangler e Funções do Wrangler.

O Wrangler oferece suporte às seguintes diretivas:

Operações de coluna

Diretiva Descrição
Mudar o caso da coluna Muda os nomes das colunas para letras minúsculas ou maiúsculas.
Como mudar a caixa Muda a caixa dos valores da coluna.
Limpar nomes de colunas Limpa os nomes das colunas, seguindo regras específicas.
Substituir colunas Altera os nomes das colunas em massa.
Texto Copia valores de uma coluna de origem para uma coluna de destino.
Coluna suspensa Descarta uma coluna em um registro.
Preencher nulos ou em branco Se o valor for nulo ou vazio, insira um valor de coluna fixo.
Keep Mantém as colunas especificadas do registro.
Mesclar Mescla duas colunas inserindo uma terceira.
Renomear Renomeia uma coluna no registro.
Definir cabeçalhos Define os nomes das colunas na ordem especificada.
Dividir em colunas Divide uma coluna com base em um separador em várias colunas.
Troca Troca os nomes de duas colunas.
Tipo do conjunto Converte o tipo de dados de uma coluna.

Transformações de data

Diretiva Descrição
Data da diferença Calcula a diferença entre duas datas.
Formatar data Padrões personalizados para formatação de data e hora.
Formatar carimbo de data/hora UNIX Formata um carimbo de data/hora UNIX como uma data.

Transformações de data e hora

Diretiva Descrição
Data/hora atual Gera a data e hora atuais com um determinado fuso horário.
Data/hora para carimbo de data/hora Cria um carimbo de data/hora a partir de um determinado fuso horário e data/hora.
Formatar data/hora Formata a data/hora como uma string de um formato específico.
Carimbo de data/hora para data/hora Converte um carimbo de data/hora em data/hora.

Codificadores e decodificadores

Diretiva Descrição
Decodificar Decodifica um valor de coluna como base32, base64 ou hex.
Codificar Codifica um valor de coluna como base32, base64 ou hex.

Hashing e mascaramento

Diretiva Descrição
Hash Gera um resumo de mensagens.
Número da máscara Aplica o mascaramento de substituição aos valores da coluna.
Embaralhamento de máscara Aplica o mascaramento aleatório aos valores das colunas.

Consultas

Diretiva Descrição
Pesquisa de catálogo Pesquisa de catálogo estático de códigos ICD-9, ICD-10-2016 e ICD-10-2017.
Consulta de tabelas Realiza pesquisas em conjuntos de dados de tabelas.

Processamento de linguagem natural

Diretiva Descrição
Formação de lema Palavras tokenizadas Aplica o algoritmo de derivação de Porter para palavras em inglês.

Formatadores de saída

Diretiva Descrição
Gravar como CSV Converte um registro no formato CSV.
Gravar como mapa JSON Converte o registro em um mapa JSON.
Escrever objeto JSON Compone um objeto JSON com base nos campos especificados.
Formatar como moeda Formata um número como moeda conforme especificado pela localidade.

Analisadores

Diretiva Descrição
Caminho JSON Usa uma DSL (uma expressão de caminho JSON) para analisar registros JSON.
Analisar como arquivo AVRO Analisa um arquivo de dados AVRO.
Analisar como CSV Analisa um registro de entrada como valores separados por vírgulas
Analisar como moeda Analisa um valor de moeda que é uma representação de string da moeda local em um número.
Analisar como data/hora Analisa a string como um tipo de dados datetime com um formato específico.
Analisar como Excel Analisa em um arquivo do Microsoft Excel.
Analisar como comprimento fixo Analisa como um registro de comprimento fixo com larguras especificadas.
Analisar o HL7 Analisa mensagens do Health Level 7 versão 2 (HL7 V2).
Analisar como JSON Analisa um objeto JSON.
Analisar como registro Analisa arquivos de registro de acesso, como servidores Apache httpd e NGINX.
Analisar como data simples Analisa strings de data.
Analisar como carimbo de data/hora Analisa os valores da coluna que representam o carimbo de data/hora Unix como data.
Analisar XML em JSON Analisa um documento XML em uma estrutura JSON.

Operações de linha

Diretiva Descrição
Filtrar linhas Filtra registros com base em uma condição.
Filtrar linha se corresponder Filtra linhas que correspondem a um padrão de uma coluna.
Flatten (link em inglês) Separa os elementos em um campo repetido.
Falha na condição O processamento falha quando a condição é avaliada como verdadeira.
Enviar para Erro Filtra registros para um coletor de erros.
Enviar para processamento de erro e continuar Filtra registros para um coletor de erros e continua o processamento.
Dividir em linhas Divide em vários registros com base em um delimitador.

Transformações

Diretiva Descrição
Como mudar a caixa Muda a caixa dos valores da coluna para caracteres maiúsculos ou minúsculos.
Criar registro Cria uma coluna de registro com valores aninhados copiando valores das colunas de origem para uma coluna de destino.
Cortar caractere Seleciona partes de um valor de string.
Definir coluna Define o valor da coluna como o resultado da execução de uma expressão.
Localizar e substituir Transforma os valores de colunas de string usando uma expressão semelhante a "sed".
Quantização. Aplica a quantização aos valores de coluna.
Extrair grupos de expressões regulares Extrai os dados de um grupo de expressões regulares para a própria coluna.
Definir o conjunto de caracteres Define a codificação e converte os dados em uma string UTF-8.
Definir delimitador de registro Define o delimitador de registro.
E-mail dividido Divide um ID de e-mail em uma conta e o domínio dela.
URL dividido Divide um URL nos elementos constituintes dele.
Distância do texto (correspondência de string difusa) Mede a diferença entre duas sequências de caracteres.
Métrica de texto (correspondência de string difusa) Mede a diferença entre duas sequências de caracteres.
Decodificação de URL Decodifica do formato MIME application/x-www-form-urlencoded.
Codificação de URL Codifica no formato MIME application/x-www-form-urlencoded.
Aparar espaços Funções para remover espaços em branco em torno de dados de string.

Agregadores e setters temporários

Diretiva Descrição
Variável de incremento Incrementa uma variável temporária com um registro de processamento.
Definir variável Define uma variável temporária com um registro de processamento.

ID exclusivo

Diretiva Descrição
Gerar UUID Gera um identificador universalmente exclusivo (UUID).

A seguir