KNIME 用于数据混合、ETL、报告和自动化
由于我们的业务受到高度监管,我们的大部分数据都托管在本地。 但是,我们的部分数据分散在多个平台和产品中。 因此,我们需要一个将所有内容集中在一个地方的平台,这就是KNIME分析平台出现的地方。 我们经常使用 KNIME 的专用数据库节点来提取数据。 接下来是大量的数据聚合和数据清理 – 基本上是ETL。 这占我们工作的70-80%。
自动化作为KNIME软件的另一个突出用途:
下一步是自动化流程,这就是KNIME服务器展示其功能的地方。特别是将KNIME Server与PowerBI等其他业务分析工具连接的可能性非常有价值。
用于报告的 KNIME:
我们使用KNIME Analytics Platform主要作为ETL工具,我们还使用KNIME Server来自动化我们的工作流程。我们有很多每日报告必须在早上准备好,所以我们很高兴有这样的解决方案。我们还将 KNIME 与其他工具(主要是 Tableau )相结合。但我总是对利益相关者说:Tableau 只是车身,KNIME 才是真正的引擎。
在西门子,数字化布道者 Philipp Kowalski 不仅将 KNIME 用于自动化、报告和 ETL,而且还将模式分析添加到 KNIME 品质列表中:
“使用KNIME的最大优势是你可以在此过程中学习。您从自动化开始,但在应用自动化时,您还会学习其他任务和节点。一个主要用途是报告。KNIME是一个很棒的报告工具。另一个经典用法是模式分析。我们一直想知道采购订单何时可能出现问题,及早发现潜在的有问题的订单对公司非常有益,因为我们可以更敏感地处理这些订单。使用KNIME对发现这些模式有很大帮助。
用于连接各种数据源的 KNIME:
“我开始使用 KNIME,因为我需要一些东西来让我处理来自各种来源的数据。”
KNIME 可实现可扩展性和易用性:
“我本质上不是一个编码员,所以对我来说,在 KNIME 中构建工作流程要快得多,也更容易访问。在我看来,最大的优势是可视化数据流的透明度和易于理解。我总是可以拉出一个工作流程,向利益相关者展示,我们可以即时解决问题。如果我在Python中这样做并同时编写代码,我将在眨眼间失去业务利益相关者的注意力。”
数据科学应用程序的无缝编排:
总结一下KNIME在企业中的使用情况,包括以下几个方面:
- 数据混合和 ETL,即使对于大型数据集也是如此。这主要归功于各种各样的连接器和数据转换节点。
- 报告,与 PowerBI、Tableau 或 KNIME WebPortal 结合使用。
- 使用 KNIME 软件生产数据科学项目,以解决数据科学应用程序中的自动化和可扩展性问题。
- 该工具易于使用,由于其低代码可视化编程方法。(这也使共享和记录更容易)