Esta página descreve as diretivas que você pode usar no Wrangler.
No modo avançado do Wrangler (a CLI do Wrangler), é possível adicionar diretivas e funções a um roteiro. Para mais informações, consulte Diretivas da CLI do Wrangler e Funções do Wrangler.
O Wrangler oferece suporte às seguintes diretivas:
Operações de coluna
Diretiva | Descrição |
---|---|
Mudar o caso da coluna | Muda os nomes das colunas para letras minúsculas ou maiúsculas. |
Como mudar a caixa | Muda a caixa dos valores da coluna. |
Limpar nomes de colunas | Limpa os nomes das colunas, seguindo regras específicas. |
Substituir colunas | Altera os nomes das colunas em massa. |
Texto | Copia valores de uma coluna de origem para uma coluna de destino. |
Coluna suspensa | Descarta uma coluna em um registro. |
Preencher nulos ou em branco | Se o valor for nulo ou vazio, insira um valor de coluna fixo. |
Keep | Mantém as colunas especificadas do registro. |
Mesclar | Mescla duas colunas inserindo uma terceira. |
Renomear | Renomeia uma coluna no registro. |
Definir cabeçalhos | Define os nomes das colunas na ordem especificada. |
Dividir em colunas | Divide uma coluna com base em um separador em várias colunas. |
Troca | Troca os nomes de duas colunas. |
Tipo do conjunto | Converte o tipo de dados de uma coluna. |
Transformações de data
Diretiva | Descrição |
---|---|
Data da diferença | Calcula a diferença entre duas datas. |
Formatar data | Padrões personalizados para formatação de data e hora. |
Formatar carimbo de data/hora UNIX | Formata um carimbo de data/hora UNIX como uma data. |
Transformações de data e hora
Diretiva | Descrição |
---|---|
Data/hora atual | Gera a data e hora atuais com um determinado fuso horário. |
Data/hora para carimbo de data/hora | Cria um carimbo de data/hora a partir de um determinado fuso horário e data/hora. |
Formatar data/hora | Formata a data/hora como uma string de um formato específico. |
Carimbo de data/hora para data/hora | Converte um carimbo de data/hora em data/hora. |
Codificadores e decodificadores
Diretiva | Descrição |
---|---|
Decodificar | Decodifica um valor de coluna como base32 ,
base64 ou hex. |
Codificar | Codifica um valor de coluna como base32 ,
base64 ou hex. |
Hashing e mascaramento
Diretiva | Descrição |
---|---|
Hash | Gera um resumo de mensagens. |
Número da máscara | Aplica o mascaramento de substituição aos valores da coluna. |
Embaralhamento de máscara | Aplica o mascaramento aleatório aos valores das colunas. |
Consultas
Diretiva | Descrição |
---|---|
Pesquisa de catálogo | Pesquisa de catálogo estático de códigos ICD-9, ICD-10-2016 e ICD-10-2017. |
Consulta de tabelas | Realiza pesquisas em conjuntos de dados de tabelas. |
Processamento de linguagem natural
Diretiva | Descrição |
---|---|
Formação de lema Palavras tokenizadas | Aplica o algoritmo de derivação de Porter para palavras em inglês. |
Formatadores de saída
Diretiva | Descrição |
---|---|
Gravar como CSV | Converte um registro no formato CSV. |
Gravar como mapa JSON | Converte o registro em um mapa JSON. |
Escrever objeto JSON | Compone um objeto JSON com base nos campos especificados. |
Formatar como moeda | Formata um número como moeda conforme especificado pela localidade. |
Analisadores
Diretiva | Descrição |
---|---|
Caminho JSON | Usa uma DSL (uma expressão de caminho JSON) para analisar registros JSON. |
Analisar como arquivo AVRO | Analisa um arquivo de dados AVRO. |
Analisar como CSV | Analisa um registro de entrada como valores separados por vírgulas |
Analisar como moeda | Analisa um valor de moeda que é uma representação de string da moeda local em um número. |
Analisar como data/hora | Analisa a string como um tipo de dados datetime com um formato específico. |
Analisar como Excel | Analisa em um arquivo do Microsoft Excel. |
Analisar como comprimento fixo | Analisa como um registro de comprimento fixo com larguras especificadas. |
Analisar o HL7 | Analisa mensagens do Health Level 7 versão 2 (HL7 V2). |
Analisar como JSON | Analisa um objeto JSON. |
Analisar como registro | Analisa arquivos de registro de acesso, como servidores Apache httpd e NGINX. |
Analisar como data simples | Analisa strings de data. |
Analisar como carimbo de data/hora | Analisa os valores da coluna que representam o carimbo de data/hora Unix como data. |
Analisar XML em JSON | Analisa um documento XML em uma estrutura JSON. |
Operações de linha
Diretiva | Descrição |
---|---|
Filtrar linhas | Filtra registros com base em uma condição. |
Filtrar linha se corresponder | Filtra linhas que correspondem a um padrão de uma coluna. |
Flatten (link em inglês) | Separa os elementos em um campo repetido. |
Falha na condição | O processamento falha quando a condição é avaliada como verdadeira. |
Enviar para Erro | Filtra registros para um coletor de erros. |
Enviar para processamento de erro e continuar | Filtra registros para um coletor de erros e continua o processamento. |
Dividir em linhas | Divide em vários registros com base em um delimitador. |
Transformações
Diretiva | Descrição |
---|---|
Como mudar a caixa | Muda a caixa dos valores da coluna para caracteres maiúsculos ou minúsculos. |
Criar registro | Cria uma coluna de registro com valores aninhados copiando valores das colunas de origem para uma coluna de destino. |
Cortar caractere | Seleciona partes de um valor de string. |
Definir coluna | Define o valor da coluna como o resultado da execução de uma expressão. |
Localizar e substituir | Transforma os valores de colunas de string usando uma expressão semelhante a "sed". |
Quantização. | Aplica a quantização aos valores de coluna. |
Extrair grupos de expressões regulares | Extrai os dados de um grupo de expressões regulares para a própria coluna. |
Definir o conjunto de caracteres | Define a codificação e converte os dados em uma string UTF-8. |
Definir delimitador de registro | Define o delimitador de registro. |
E-mail dividido | Divide um ID de e-mail em uma conta e o domínio dela. |
URL dividido | Divide um URL nos elementos constituintes dele. |
Distância do texto (correspondência de string difusa) | Mede a diferença entre duas sequências de caracteres. |
Métrica de texto (correspondência de string difusa) | Mede a diferença entre duas sequências de caracteres. |
Decodificação de URL | Decodifica do formato MIME
application/x-www-form-urlencoded . |
Codificação de URL | Codifica no formato MIME
application/x-www-form-urlencoded . |
Aparar espaços | Funções para remover espaços em branco em torno de dados de string. |
Agregadores e setters temporários
Diretiva | Descrição |
---|---|
Variável de incremento | Incrementa uma variável temporária com um registro de processamento. |
Definir variável | Define uma variável temporária com um registro de processamento. |
ID exclusivo
Diretiva | Descrição |
---|---|
Gerar UUID | Gera um identificador universalmente exclusivo (UUID). |
A seguir
- Saiba mais sobre as funções do Wrangler.