数据源是ETL流程的起始点,也是整个流程的基础,Power Query之所以功能强大,一个重要的特性就是PQ支持多种数据源。
-
从文件:不仅支持工作簿文件,还支持文本文件(CSV、XML、文本),在Excel 2019中支持“从JSON”功能。“从文件夹”功能非常强大,可以直接导入指定文件中的多个文件。
-
从数据库:除了微软自家的SQL Server和Access,还支持Oracle、DB2、MySQL等多种主流关系数据库,甚至还支持SSAS OLAP。
-
从Azure:支持微软Azure云上的多种服务。
-
从在线服务:支持SharePoint、Exchange、Facebook、Salesforce等多种在线服务。
-
从其他源:支持自网站、OData、AD、ODBC、空白查询等。
-
从表格
这么多数据源是否有些眼花缭乱的赶脚,其实对于多数用户来说,很少能够用到Azure和在线服务,商用数据库可能会略有接触,最常用的功能还是“从文件”和“从其他源”中的自网站、从ODBC和空白查询。