在 bipp,我们喜欢谈论数据。其中,考虑到我们的谋生手段,这并不奇怪。随着我们进入新的一年,数据对话继续发展。另一个围绕太阳的轨道似乎是专心凝视比普水晶球的好时机。那么,这里有一些关于我们认为将在 2022 年及以后推动数据分析和 BI 对话的想法。

1. 数据驱动的公司已死——分析文化万岁

虽然我们已经对数据驱动的企业进行了一段时间的消磨,但现在是转移焦点的时候了。如果我们从 COVID 的黑暗岁月中学到了什么,那就是使用数据为决策提供信息是业务增长和活力的关键。例如,销售主管可以应对收入下降到单个产品和商店级别的情况,同时,人力资源部门可以将外部劳动力数据与历史趋势相结合,调整工资和福利以减少客户流失。

但是这是一个很大的问题:如果只是将 BI 平台添加到您的业务应用程序堆栈中,它并不能创建一个数据驱动的企业。相反,它只会给许多 IT 或 BI 团队带来更多麻烦。

使用这种先马后水的方法来提高技能,这些应用程序只是另一种学习工具,而且由于许多 BI 工具缺乏直观的设计,它们很快就被抛弃了。因此,虽然企业中的人们都会在智力上理解 BI 平台的潜在好处,但他们并不都具备数据素养。

真正的好处来自文化变革。如果你不采取积极措施来创造一种文化,就会在你周围(或尽管你)创造一种文化,对于分析和 BI 尤其如此。

到 2022 年,重点必须转移,这将迫一使平台开发者和公司内部发生变化。自助式 BI本身并不能带来改变,是选择繁忙的业务用户可以轻松导航的工具是个好的开始。但是,除了光滑的界面之外,还需要强大的数据模型作为企业范围内的单一事实来源。如果您没有投入时间来定义一个承载业务逻辑的层,以供组织的其他成员探索,那么自助服务 BI 除了创建一系列无休止的帮助台票证之外,将一无所获。

通过将仪表板嵌入到他们知道的 Intranet 或应用程序中,让人们可以根据自己的条件访问工具。通过确保每个人都使用相同的语言来表示关键 KPI 和干净的数据来建立信任。并将实践培训与可以扩展业务的平台相结合,认识到在企业范围内利用 BI 所需的文化转变。

2. 数据建模层为人们带来自助服务 (BI) 能力

自助服务 BI 理论非常出色。它的逻辑在很大程度上借鉴了凯文·科斯特纳(Kevin Costner)1989年的经典之作《梦之田》(Field of Dreams),其中玉米农民雷·金塞拉(Ray Kinsella)说出了一句标志性的台词,”如果你建造它,他们就会来,(好吧,’他’会来,如果你是一个坚持细节的人)。金塞拉提到了他在玉米地里建造的一颗棒球钻石,以及过去时代的棒球运动员(包括他的父亲)会回来的希望。但在生活中(就像在玉米地里的棒球电影中一样),仅仅因为你建造了一些东西并不意味着它们会来。

我们都明白这个逻辑。自助服务——绕过 IT——意味着业务用户可以更好地应对机会并解决问题。但这会产生冲突。IT 的职责是保护基础架构、维护单一事实来源,并确保数据副本不会像疯了似的散布在整个企业中。这可能与最终用户对灵活性、对工具的偏好和独立工作能力的渴望背道而驰。

自助服务分为三个关键领域:

自助服务在三个关键领域有所下降:

  1. 混乱的业务指标

    BI 工具需要数据。不是火箭科学。但是,如果每个单位都在大公司中创建其定义和指标,那么当您跨单位比较报告时,就会造成混乱。如果没有集中式模型,业务就会不协调。这意味着每个小组得出不同的结论,没有人会相信这些数字。

  2. 业务用户不是数据工程师。

    大多数商人都离数学有一英里。但是,某些自助服务选项迫使业务用户花费越来越多的时间来管理数据。最终,他们造成的混乱最终将回到IT。因此,虽然企业当然应该亲身体验可视化和仪表板,但他们不必在数据更改时扮演工程师的角色。

  3. 自助服务无法扩展

    是的,企业希望更加敏捷。自助服务无疑可以通过加快获得洞察的时间来提供帮助。但是,当一个业务部门增长或需要跨多个品牌扩展指标时,车轮开始脱落。当然,自助服务BI工具比等待问题跟踪票证得到解决更快,但对于快速增长的公司来说还不够敏捷。

2022年是实现自助服务权的一年。

通过在一个地方定义可重用的数据模型,IT 可以足够灵活地通过数据建模层支持自助服务。SQL 表达式和语句代表承载业务逻辑的层(因此 KPI 和指标是一致的)。现代数据建模层是为当今的复杂数据而构建的,但应包括可视化数据模型,从而无需编写代码即可轻松创建强大的数据模型。相反,团队应该使用简单的拖放列与数据库模式进行交互并实时进行编辑。

有了这个,自助服​​务业务用户可以基于相同的可信逻辑做出决策,因为相同的语言代表关键 KPI。例如,他们可以创建仪表板、信任他们的可视化并轻松地实时过滤它们。这意味着他们正在根据最新的实时信息做出决策。

3. Ayes(眼睛!)拥有它

我讨厌看负面的东西。但有时,它们是发现积极因素的最佳方式。所以请耐心等待。您会看到,创建 bipp 是为了帮助所有企业从数据中获得洞察力,以帮助做出明智的决策。这是一个很大的保险杠贴纸(不要让我开始写我们的名片),但这是我们喜欢的东西。但是,不幸的是,虽然这是一个伟大的、宏伟的、艰巨的目标,但我们发现它可能超出了某些公司的能力范围。这并不总是出于您想的原因。

奇怪的是,第一个挑战是 SQL 数据建模(见预测二)。我们知道数据建模的重要性。单一事实来源、可重用性、协作性、yadda、yadda、yadda。我们创建了一种易于使用的语言,它简化了 SQL,包括动态分析函数,降低了数据堆栈的复杂性,并直接连接到您的数据仓库。你知道吗?人们喜欢它!只是……并非所有数据团队都喜欢学习一门新语言(即使是只使用 31 个关键字的语言)。

第二个挑战?不是每个人都可以编码。这会让许多读者感到震惊。但这是一个可悲的现实。因此,如果 BI 解决方案依赖于编码技能,那么无论可视化和仪表板多么出色,它都可能不适合您的公司。我们意识到,您不必学习编程语言即可从数据中获得洞察力,尤其是在您致力于建立数据文化但没有庞大的数据分析团队的情况下。

所以我们生活在一个我们想要更好的工具(但又不想​​学习一门新语言)并且我们根本不想学习任何语言的世界里。2022 年,我们将解决这个问题。

这些挑战的答案?是的(眼睛!)有它。我们使用视觉感知多达 80% 的印象。在一个无代码/低代码、自助服务技术的时代,我们最好拥抱视觉优先的 BI 世界。具体来说,不愿意学习新语言来创建数据模型的数据工程师将需要可视化数据模型。他们将使用强大的点击式可视界面生成数据模型。并且可以使用简单的拖放列与数据库模式进行交互。分析师可以在使用数据预览窗格提交之前实时进行编辑并测试模型。他们无需编写任何代码即可访问语言创建模型的所有功能。

对于那些想要在没有编程知识的情况下快速提取和管理数据并构建图表的人?2022 年的答案将是可视化 SQL,它可以让他们混合数据并从不同的来源创建图表,而无需通过 ETL 管道。使用直观、灵活的拖放界面,企业中的用户将根据自己的条件探索和可视化数据。最好的部分是什么?他们可以直观地连接到领先的数据库,并快速提取和管理数据、构建图表和仪表板,所有这些都无需编程知识。

4. 革命将得到加强

上次我查看Gartner 分析和商业智能炒作周期时,增强分析正徘徊在幻灭的低谷。对于那些不遵循 Gartner 的可视化方法来分析技术和应用程序的成熟度和采用率的人来说,这意味着随着实验和实施未能交付,人们对某个主题的兴趣正在减弱。他们预测该技术的生产商将失败,只有幸存的供应商改进他们的产品,投资才会继续。好消息?那些在低谷中幸存下来的人在突破到生产力的高原之前沿着启蒙的斜坡上升。

除了 Gartner 的地理位置,我们认为增强分析将在 2022 年走上快车道。这有几个原因。首先,每天创建 1.145 万亿 MB 的数据。坦率地说,诸如机器学习和人工智能等支持技术必须协助数据准备、分析、清理、加入、探索和洞察力的生成/解释。

随着所有公司都自豪地宣称自己是数据公司,增强人们在分析和 BI 平台中探索和分析数据的方式不再是一件好事。然而,分析师、工程师和数据科学家只有这么多,因此增强分析将成为主流采用的实际驱动力。

在 bipp,我们认为推动这一点的功能是增强分析。用户 – 以及他们向其报告的人 – 需要了解洞察力是如何产生的,基础数据是否存在潜在偏见或任何风险。增强分析采用关键业务指标,让平​​台探索数百万种组合,确定最大影响,将这些作为事实揭示,并按重要性顺序排列它们的优先级。所有这些都无需了解查询语言,例如 SQL。通过自然语言生成,平台将能够以英语响应查询并提供视觉上下文,以便用户可以更快地生成 – 并证明 – 洞察力。

这里的关键是速度和准确性。这种类型的增强分析专为大规模处理数据而设计。在受信任的数据模型和数据库内(因此处理在数据库内进行)的支持下,我们认为这将有助于将公司从分析焦虑转移到分析文化。

5. 数据工程师年

《时代》杂志2021 年年度人物是埃隆·马斯克。当然,在过去的 12 个月里,电动汽车、无聊公司、SpaceX 和火焰喷射器的推特之王无可否认地为人类(和加密)做了很多。但我们认为有一个新的(嗯,旧的?)球员在 2022 年有很好的机会。那就是不那么谦虚的数据工程师。

在过去的日子里,数据工程师是系统构建者、数据传输者和后端工程师。今天的数据工程师移动、塑造和定义从生成到消费的数据。他们为需要查询数据的工具构建数据管道并有效地存储数据。至关重要的是,他们分析数据并确保其遵守数据治理规则和法规。

数据工程师在努力简化数据堆栈时,必须将工具与代码结合起来。现实情况是,数据工程变得越来越难,尤其是在 GDPR 和 CCPA 等新的合规性要求下。团队现在必须评估新工具,研究如何将它们与现有工具集成,并设置 DevOps 实践以将它们纳入数据堆栈,与当地和全球法规同步。成功需要 DevOps 的采用与数据治理计划的实施之间有很强的相关性。

数据工程技能是解决关键业务技术问题的理想选择。每个企业都必须为团队提供最好的工具,同时保持统一、灵活的数据层。工程师将需要构建和操作解决这些问题的数据堆栈,并负责机器学习、分析报告和决策管理。

其核心是他们的 SQL 技能。有了这项技能,他们可以阅读和理解数据库执行计划、索引如何工作、不同的连接算法和分布式维度。

实体关系数据建模也应该是一种反射,以及对规范化的清晰理解,以及对非规范化权衡的敏锐直觉。数据工程师应该熟悉维度建模和相关概念。

凭借这些核心技能,数据工程师将成为 2022 年最关键的业务和技术合作伙伴,负责消除 IT/工程与其他学科之间的分裂。