2022 年 16 个最佳数据科学和机器学习平台

Altair

相关产品: Altair Knowledge Studio、Altair Knowledge Studio for Apache Spark、Altair Knowledge Hub、Altair Panopticon、Altair Monarch

Altair(前身为 Datawatch)通过其 Knowledge Works 产品组合提供一套解决方案,并以名为 Knowledge Studio 的高级数据挖掘和预测分析工作台为主角。该产品具有获得专利的决策树、策略树以及工作流和向导驱动的图形用户界面。它还包括数据准备任务、可视化数据分析、高级预测建模和数据库内分析功能。用户可以使用 R 和 Python 等常用语言以及 SAS、RDBMS、CSV、Excel 和 SPSS 等数据类型进行导入和导出。

Alteryx

相关产品:  Alteryx Designer、Alteryx Intelligence Suite、Alteryx Server、Alteryx Connect、Alteryx Promote

描述: Alteryx 通过 一套 软件 产品提供数据科学和机器学习功能。Alteryx Designer 以自动化数据准备、数据混合、报告、预测分析和数据科学为主导,吹捧超过 260 个拖放构建块。Alteryx 让用户可以快速查看变量关系和分布, 并 轻松选择和比较算法性能。 当软件可以部署在云中、您自己的防火墙后面或托管环境中时,无需编码。 

Anaconda

相关产品: Anaconda Distribution、Anaconda Team Edition

描述: Anaconda 通过许多不同的产品版本提供其数据科学和机器学习功能。它的旗舰产品是 Anaconda Enterprise,这是一个以 Python 和 R 为重点的开源平台。该工具使您能够在 Linux、Windows 和 Mac OS 上执行数据科学和机器学习。Anaconda 允许用户下载超过 1,500 个 Python 和 R 数据科学包,管理库、依赖项和环境,并使用 Dask 、NumPy、pandas 和 Numba分析数据。然后,您可以使用 Matplotlib、Bokeh、  Datashader和 Holoviews可视化在 Anaconda 中生成的结果 

Databricks

平台: Databricks 统一分析平台

描述: Databricks 提供了一个基于云和 Apache Spark 的统一分析平台,该平台结合了数据工程和数据科学功能。该产品利用了一系列开源语言,并包括用于 Amazon Web Services 上的操作、性能和实时启用的专有功能。数据科学工作区使用户能够协作探索数据和构建模型。它还提供对预配置 ML 环境的一键访问,以使用流行的框架进行增强机器学习。 

Dataiku

平台: Dataiku Data Science Studio (DSS)

描述: Dataiku 提供了一种高级分析解决方案,允许组织创建自己的数据工具。该公司的旗舰产品为数据分析师和数据科学家提供基于团队的用户界面。Dataiku 用于开发和部署的统一框架提供了对从头开始设计数据工具所需的所有功能的即时访问。然后,用户可以应用机器学习和数据科学技术来构建和部署预测数据流。 

DataRobot

平台: DataRobot企业人工智能平台

相关产品: Paxata 数据准备、自动化机器学习、自动化时间序列、MLOps

描述: DataRobot提供了一个企业 AI 平台,可自动执行构建、部署和维护 AI 的端到端流程。该产品由开源算法提供支持,可以在本地、云端或作为完全托管的 AI 服务使用。 DataRobot 包括 几个 独立但完全集成的工具(Paxata 数据准备、 自动化机器学习、自动化时间序列、  MLOps和 AI 应用程序),每个工具都可以以多种方式部署,以满足业务需求和 IT 要求。

Domino

平台:Domino Data Science Platform

相关产品: Domino Model Monitor

描述: Domino Data Lab 提供了一个企业数据科学平台,允许数据科学家构建和运行预测模型。该产品通过基础设施自动化和协作帮助组织开发和交付这些模型。Domino 为用户提供对数据科学工作台的访问权限,该工作台提供用于批量实验的开源和商业工具以及模型交付,以便他们可以发布 API 和 Web 应用程序或安排报告

Google Cloud

平台:谷歌云人工智能平台

相关产品: Google Cloud Data Fusion、Google Cloud AutoML、Google BigQuery ML、Google AI Platform Notebooks、Google TensorFlow

描述: Google Cloud AI 提供了该领域最大的机器学习堆栈之一,并为各种用例提供​​了不断扩展的产品列表。该产品是完全托管的,并通过可解释的模型提供出色的治理。主要功能包括内置的数据标签服务、  AutoML 、通过 AI Explanations 进行的模型验证、帮助您了解模型输出的假设分析工具、使用预测的云模型部署以及  通过管道工具进行的MLOps 。 

H2O.ai

平台: H2O无人驾驶AI

相关产品: H2O 3、H2O AutoML for ML、H2O Sparkling Water for Spark Integration、H2O Wave

描述: H2O.ai 提供许多 AI 和数据科学产品,其商业平台 H2O Driverless AI 是其中的佼佼者。无人驾驶 AI 是一个完全开源的分布式内存机器学习平台,具有线性 可扩展性。H2O 支持广泛使用的统计和机器学习算法,包括梯度增强机器、广义线性模型、深度学习等。H2O 还开发了 AutoML 功能,可自动运行所有算法以生成最佳模型排行榜。 

IBM

平台: IBM 沃森工作室

相关产品: IBM Cloud Pak for Data、IBM SPSS Modeler、IBM Decision Optimization、IBM Watson Machine Learning

描述: IBM Watson Studio 使用户能够跨任何云大规模构建、运行和管理 AI 模型。该产品是公司主要数据和人工智能平台 IBM Cloud Pak for Data 的一部分。该解决方案可让您自动化 AI 生命周期管理、管理和保护开源笔记本、可视化准备和构建模型、通过一键式集成部署和运行模型,以及使用可解释的 AI 管理和监控模型。IBM Watson Studio 提供了一个灵活的架构,允许用户利用PyTorch 、TensorFlow 和 scikit-learn等开源框架 。

KNIME

平台: KNIME 分析平台

相关产品: KNIME 服务器

描述: KNIME Analytics 是一个用于创建数据科学的开源平台。它可以通过无需编码的拖放式图形界面创建可视化工作流程。用户可以从 2000 多个节点中进行选择,以构建工作流、对分析的每个步骤进行建模、控制数据流并确保工作是最新的。KNIME 可以混合来自任何来源的数据和形状数据以获取统计数据、清理数据以及提取和选择特征。该产品利用人工智能和机器学习,可以使用经典和高级图表可视化数据。 

MathWorks

平台: MATLAB

相关产品: Simulink

描述: MathWorks MATLAB 将针对迭代分析和设计过程调整的桌面环境与直接表达矩阵和数组数学的编程语言相结合。它包括实时编辑器,用于创建在可执行笔记本中组合代码、输出和格式化文本的脚本。MATLAB 工具箱经过专业开发、测试和完整记录。MATLAB 应用程序还可以让您了解不同的算法如何处理您的数据。

Micosoft

平台: Azure 机器学习

相关产品:  Azure 数据工厂、Azure 数据目录、Azure HDInsight、Azure Databricks、Azure DevOps、Power BI

描述: Azure 机器学习服务让开发人员和数据科学家能够构建、训练和部署机器学习模型。该产品通过代码优先和拖放式设计器以及自动化机器学习为所有技能水平提供生产力。它还具有与现有 DevOps 流程集成的扩展 MLops 功能。该服务吹捧负责任的机器学习,因此用户可以理解具有可解释性和公平性的模型,并通过差异隐私和机密计算保护数据。Azure 机器学习支持开源框架和语言,例如 MLflow 、Kubeflow、ONNX、  PyTorch 、TensorFlow、Python 和 R。 

RapidMiner

平台: RapidMiner Studio

相关产品:  RapidMiner AI Hub、RapidMiner Go、RapidMiner Notebooks、RapidMiner AI Cloud

描述: RapidMiner 提供了一个数据科学平台,使企业中所有技能水平的人员都能够构建和操作人工智能解决方案。该产品涵盖了人工智能生产过程的全生命周期,从数据探索和数据准备到模型构建、模型部署和模型操作。RapidMiner 提供了数据科学家所需的深度,但通过可视化用户界面为其他所有人简化了 AI,该界面简化了构建和理解复杂模型的过程。

SAS

平台: SAS 可视化数据挖掘和机器学习

相关产品:  SAS Viya、SAS 视觉机器学习、SAS 视觉数据科学、SAS 数据科学编程、SAS 视觉数据决策

描述: SAS 提供一套先进的分析和数据科学产品 ,以 SAS可视化数据挖掘和机器学习为主题该产品提供 对任何格式和任何来源的数据的访问, 以及 自动化的数据准备和 数据沿袭和模型管理。SAS 可视化数据挖掘和机器学习自动生成跨模型常见变量的见解。它还具有用于创建项目 摘要的自然语言生成功能。配套的 SAS 模型管理器使用户能够在项目中或作为独立模型注册 SAS 和开源模型。

TIBCO

平台: TIBCO 数据科学

相关产品: TIBCO Spotfire、TIBCO Streaming

描述: TIBCO 为现代 BI、描述性和预测性分析以及流分析和数据科学提供广泛的产品组合。TIBCO Data Science 让用户可以进行数据准备、模型构建、部署和监控。它还具有 AutoML 、拖放式工作流程和嵌入式 Jupyter  Notebooks,用于共享可重用模块。用户可以在 TIBCO 的 Spotfire Analytics 上运行工作流,并利用 TensorFlow、SageMaker、  Rekognition 和 Cognitive Services 来编排开源。