编码和解码行

本页面介绍了如何在执行下列操作时对行进行编码和解码 在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据。

对行进行编码

您可以使用数据的基本编码,在环境中存储或传输数据 而由于旧版原因,它们被限制为使用 US-ASCII 数据。您可以在不受这些旧版限制的新应用中使用它,因为它允许使用文本编辑器操控对象。

您可以将以下基于 RFC-4648 的编码方案应用于列中的所有值:

  • Base32
  • Base64
  • 十六进制颜色值
  • 网址

编码时,Wrangler 会生成一个新列,其名称如下所示 格式:<column>_encode_<type> except for url-encode

Cloud Data Fusion 对列值使用以下规则:

  • 如果此列为 null,则生成的列也将为 null
  • 如果在行中找不到所选列,则会跳过该行。
  • 如果列值没有字符串或字节数据类型,则 转换失败,并显示错误。

支持的编码选项

Wrangler 支持以下编码选项:

使用 base64 编码
Base64 选项将 encode64 指令添加为转换步骤 并创建一个包含编码值的新列。
使用 base32 编码
Base32 选项将 encode32 指令添加为转换步骤 并创建一个包含编码值的新列。
对十六进制编码
Hex 选项添加 encode_hex 指令作为转换步骤 并创建一个包含编码值的新列。
对网址进行编码
网址 选项添加 url-encode 指令作为转换步骤 并编码当前列。

解码行

您可以使用数据的底层解码功能,在出于旧版原因而仅限于 US-ASCII 数据的环境中存储或传输数据。您可能会在 因为它支持 使用文本编辑器处理对象。

您可以应用以下解码方案,它们基于 RFC-4648, 应用于列中的每个值:

  • Base32
  • Base64
  • 十六进制颜色值
  • 网址

解码时,Wrangler 会生成一个新列,其名称如下所示 格式:<column>_encode_<type>url-decode 除外)。

Cloud Data Fusion 对列值使用以下规则:

  • 如果此列为 null,则生成的列也将为 null
  • 如果行中未找到所选列,系统会跳过该行。
  • 如果列值不包含字符串或字节数组数据类型,则 操作失败。

支持的解码选项

Wrangler 支持以下编码选项:

解码 base64 内容
base64 选项添加 decode64 指令作为转换步骤 然后创建一个新列,其中包含解码后的值。
以 base32 编码
base32 选项会将 decode32 指令作为转换步骤添加到食谱中,并创建一个包含解码值的新列。
对十六进制解码
Hex 选项添加 decode hex 指令作为转换步骤 然后创建一个新列,其中包含解码后的值。
解码网址
网址 选项添加 url-decode 指令作为转换步骤 并解码当前列。

后续步骤