参考文章:
主要解释:
Select Transform功能允许指定启动一个子进程,将输入数据按照一定的格式通过stdin输入子进程,并且通过parse子进程的stdout输出来获取输出数据。能在不编写UDF的前提下实现MaxCompute SQL不具备的功能。
最近的脚本涉及到的用法:
SELECT
TRANSFORM (foo, bar)
USING 'python add_mapper.py'
AS (foo string, bar map<string,int>)
FROM t3;