Top
首页 > 正文

谷歌云(Google Cloud)上线AI Platform Notebooks 智能分析框架

AI Platform Notebooks中的Apache Beam框架允许您在apachebeam中交互地开发管道,使用工作流简化从原型到生产的过程。
发布时间:2020-05-29 13:15        来源:TechWeb        作者:TechWeb

AI Platform Notebooks 是一项托管式服务,为数据科学家和机器学习开发者提供安全的集成式 JupyterLab环境(JupyterLab 实例是一个深度学习虚拟机实例,预装有最新的机器学习和数据科学库) ,帮助他们进行实验、开发模型以及将模型部署到生产环境。

Google Cloud针对AI Platform Notebooks发布了智能分析框架(Smart Analytics Frameworks)的beta版。Smart Analytics Frameworks通过智能分析平台的提取,预处理,使得智能分析平台提供的模型训练和部署更加紧密,同时有助于缩小云工具之间的差距,并为探索各种数据提供一种安全的方法。

无论您是在共享可视化、演示分析,还是使用40多种编程语言与实时代码交互,Jupyter notebooks(Jupyter notebooks是将实时可运行代码与Markdown,方程式,图像,交互式可视化以及其他丰富输出结合在一起的文档)都是处理数据的主流用户界面。随着数据量的增长,企业希望从这些数据中获得更多,数据管道的类型、数据源的可用性以及这些AI Platform Notebooks提供的插件都有了迅速的增长。虽然这种功能的激增使数据用户能够深入了解最棘手的业务问题,但数据分析能力的增强同时也增加了工作量:数据工程和数据科学团队花太多时间安装库,将不同系统之间的集成拼凑在一起,并配置基础结构。同时,IT运营商也在努力创建企业标准,并在这些AI Platform Notebooks环境中实施数据保护。

我们针对AI Platform Notebooks 新智能分析框架为Jupyter notebooks提供了智能分析产品套件,因此数据科学家和工程师可以快速利用数据,而不必为统一人工智能和数据工程系统带来集成负担。IT运营商还可以放心,AI Platform Notebooks的安全性是通过单个集线器来实现的,无论数据工作流是从BigQuery中提取数据、使用Dataproc转换数据,还是运行交互式ApacheBeam管道,AI Platform Notebooks 中的端到端支持,允许充当组织中数据的可信网关。

如何使用新框架

要开始使用智能分析框架,请转到Google Cloud控制台中的"AI Platform"页面。选择New Instance,然后从Data Analytics菜单中选择Apache Beam或Dataproc Hub。Apache Beam选项将启动一个VM,该VM预先配置了一个交互式环境,用于在Beam的direct runner上对apachebeam管道进行原型设计。Dataproc Hub选项将启动一个VM,运行一个定制的JupyterHub实例,该实例将生成生产级、独立的、自动缩放的Apache Spark环境,这些环境可以由管理员预先定义,但可以由每个数据用户个性化。所有的AI Platform Notebooks 框架都预先打包了BigQuery库,使得使用BigQuery作为notebooks的数据源变得很容易。

Apache Beam是一个开源框架,它统一了批处理和流式处理管道,因此开发人员不需要为其各种数据处理需求管理两个独立的系统。AI Platform Notebooks中的Apache Beam框架允许您在apachebeam中交互地开发管道,使用工作流简化从原型到生产的过程。开发人员可以检查他们的数据转换并对中间数据执行分析,然后启动Dataflow,这是一个完全托管的数据处理服务,它将您的工作负载分布在一组虚拟机上,开销为零到很少。使用Apache Beam交互框架,Python开发人员比以往任何时候都更容易开始流分析,而设置您的环境只需单击几下鼠标即可。

过去,由于很难从根深蒂固的整体架构模式过渡到Hadoop / Spark,因此公司在云计算旅程中遇到了障碍。通过Dataproc Hub,可以轻松现代化运行在Prem上的低效多租户集群。通过这种适用于Spark notebooks的新方法,您可以为用户提供一个环境,数据科学家可以根据其公司的安全标准和数据访问策略完全控制和个性化。

AI Platform Notebooks的智能分析框架目前还是一个公开的Beta版,您现在可以使用,使用不收费,您只需为实例中使用的云资源付费:BigQuery,Cloud Storage,Dataproc或Compute Engine。

合作站点
stat