本页面介绍了如何在执行下列操作时对行进行编码和解码 在 Cloud Data Fusion Studio 的 Wrangler 工作区中准备数据。
对行进行编码
您可以使用数据的基本编码,在环境中存储或传输数据 而由于旧版原因,它们被限制为使用 US-ASCII 数据。您可以在不受这些旧版限制的新应用中使用它,因为它允许使用文本编辑器操控对象。
您可以将以下基于 RFC-4648 的编码方案应用于列中的所有值:
- Base32
- Base64
- 十六进制颜色值
- 网址
编码时,Wrangler 会生成一个新列,其名称如下所示
格式:<column>_encode_<type> except for url-encode
。
Cloud Data Fusion 对列值使用以下规则:
- 如果此列为
null
,则生成的列也将为null
。 - 如果在行中找不到所选列,则会跳过该行。
- 如果列值没有字符串或字节数据类型,则 转换失败,并显示错误。
支持的编码选项
Wrangler 支持以下编码选项:
- 使用 base64 编码
- Base64 选项将
encode64
指令添加为转换步骤 并创建一个包含编码值的新列。 - 使用 base32 编码
- Base32 选项将
encode32
指令添加为转换步骤 并创建一个包含编码值的新列。 - 对十六进制编码
- Hex 选项添加
encode_hex
指令作为转换步骤 并创建一个包含编码值的新列。 - 对网址进行编码
- 网址 选项添加
url-encode
指令作为转换步骤 并编码当前列。
解码行
您可以使用数据的底层解码功能,在出于旧版原因而仅限于 US-ASCII 数据的环境中存储或传输数据。您可能会在 因为它支持 使用文本编辑器处理对象。
您可以应用以下解码方案,它们基于 RFC-4648, 应用于列中的每个值:
- Base32
- Base64
- 十六进制颜色值
- 网址
解码时,Wrangler 会生成一个新列,其名称如下所示
格式:<column>_encode_<type>
(url-decode
除外)。
Cloud Data Fusion 对列值使用以下规则:
- 如果此列为
null
,则生成的列也将为null
。 - 如果行中未找到所选列,系统会跳过该行。
- 如果列值不包含字符串或字节数组数据类型,则 操作失败。
支持的解码选项
Wrangler 支持以下编码选项:
- 解码 base64 内容
- base64 选项添加
decode64
指令作为转换步骤 然后创建一个新列,其中包含解码后的值。 - 以 base32 编码
- base32 选项会将
decode32
指令作为转换步骤添加到食谱中,并创建一个包含解码值的新列。 - 对十六进制解码
- Hex 选项添加
decode hex
指令作为转换步骤 然后创建一个新列,其中包含解码后的值。 - 解码网址
- 网址 选项添加
url-decode
指令作为转换步骤 并解码当前列。
后续步骤
- 详细了解 Wrangler 指令。