走进 OCW | 甲骨文宣布推出 MySQL HeatWave Lakehouse |
发布时间:2023/3/13 访问人数:985次 |
新闻稿 /Announcement 甲骨文公司今天宣布推出 MySQL HeatWave Lakehouse,这款产品能够帮助客户处理和查询对象存储中数百 TB 量级的数据,支持各种文件格式,包括 CSV、Parquet 以及 Aurora 和 Redshift 备份格式。MySQL HeatWave Lakehouse 是 MySQL HeatWave 产品组合的新产品,能够将事务处理、分析、机器学习和基于机器学习的自动化结合在单一 MySQL 数据库中。
MySQL HeatWave Lakehouse 采用大规模并行横向扩展 MySQL HeatWave 架构,根据行业标准基准测试的结果,在运行查询和加载数据性能方面表现出色。此外,客户可以通过单个查询在 MySQL 数据库中查询事务处理数据,并使用标准 MySQL 语法将其与对象存储中的数据组合。甲骨文还宣布推出新的 MySQL Autopilot 功能,可提高性能并让 MySQL HeatWave Lakehouse 方便易用。MySQL HeatWave 现推出了 Lakehouse 的 Beta 版供客户试用,正式版将于 2023 上半年发布。
客户从 AWS、Google 和本地环境迁移到 MySQL HeatWave 之后,已经在各种场景中使用该产品,包括营销分析,特别是广告营销活动效果的实时分析与客户数据分析,从而构建有效的营销活动。还有其他一些客户也从 AWS 迁移到这款产品上,包括汽车、电信、零售、高科技和医疗保健行业的佼佼者。
甲骨文公司首席企业架构师 Edward Screven 表示: MySQL HeatWave 是多年研究和开发的成果,我们正在将其转化为突破性创新,以应对 MySQL 客户面临的更大挑战。事实上,MySQL HeatWave Lakehouse 是我们今年就 MySQL HeatWave 的第三个重大发布。存储在数据库之外的数据急剧增长,借助 MySQL HeatWave Lakehouse,客户可以利用 HeatWave 在各方面的优势,处理驻留在对象存储中的数据。MySQL HeatWave 目前在多个云平台上提供一项集成服务,用于事务处理、跨数据仓库和数据湖的分析以及无需数据仓库技术 (ETL) 的机器学习。这样的组合有助于在性能、自动化和成本方面实现大幅度改进,因此进一步加大了 MySQL HeatWave 相较于其他云端数据库服务的优势。
AMD 首席技术官兼执行副总裁 Mark Papermaster 表示: 我们很高兴能够继续与甲骨文开展合作,并将合作范围延伸到支持其新的 MySQL HeatWave Lakehouse 产品,该产品经过优化,可充分利用我们处理器的各类创新,在由 AMD EPYC 驱动的 Oracle 云实例上运行。AMD 和甲骨文工程团队携手努力,打造出令人印象深刻的 MySQL 解决方案,它能在单个 MySQL 数据库中为事务处理、分析、机器学习和基于机器学习的自动化提供出色的可扩展性和性能。
甲骨文公司还发布了新的 Lakehouse 基准测试,并为 MySQL HeatWave Lakehouse 和 MySQL Autopilot 引入了多项创新功能。 Futurum Research 高级分析师兼研究总监 Ron Westfall 表示: MySQL HeatWave Lakehouse 以惊人的速度在以往未曾涉足的 400 TB 云端数据库基准领域开辟出了自己的道路,让这一领域的竞争比以往更加激烈。从处理能力和计算能力来看,MySQL HeatWave Lakehouse 堪称 HeatWave 的一次重大飞跃:从 32 TB 和 64 个节点提升到 400 TB 和 512 个节点。
创新功能 更大数据量,标准 MySQL 语法 客户可以通过 MySQL HeatWave Lakehouse 查询多达 400 TB 的数据,HeatWave 集群可扩展到 512 个节点。客户可使用标准 MySQL 语法查询数据。
稳定的性能和压缩表现 MySQL HeatWave 为存储在 MySQL 数据库或对象存储中的数据提供相同的查询性能,10 TB 和 30 TB TPC-H 基准测试结果印证了这一点。此外,在这两种情况下,它所实现的压缩量和每个节点可以处理的数据量都是相同的。
支持多种文件格式 使用 MySQL HeatWave Lakehouse,客户可以加载和处理以各种文件格式存储的数据,例如 CSV 和 Parquet,以及 AWS 的 Aurora 和 Redshift 备份格式。因此,即便客户的数据并未存储在 MySQL 数据库内,他们也能从 MySQL HeatWave 的优势中获益。无论数据使用何种文件格式存储,客户始终可获得稳定的查询性能。
支持查询 MySQL 中的数据并将其与对象存储中的数据组合 使用 MySQL HeatWave Lakehouse, 客户可以查询存储在 MySQL 数据库中联机事务处理过程 (OLTP) 数据,并将其与存储在对象存储中的数据组合。对 OLTP 数据所做的任何更改都会实时更新,并体现在查询结果中。
新 MySQL Autopilot 功能 MySQL Autopilot 为 MySQL HeatWave 提供基于机器学习的自动化功能。多项现有 MySQL Autopilot 功能(如自动预配和自动查询计划改进)针对 MySQL HeatWave Lakehouse 进行了增强,从而进一步降低数据库管理开销并提高性能。此外,我们如今还为 MySQL HeatWave Lakehouse 提供了诸多 MySQL Autopilot 新功能。
自动模式推断 Autopilot 可自动推断文件数据到数据库中数据类型的映射。因此,客户无需手动为要由 MySQL HeatWave Lakehouse 查询的每一个新文件指定映射,从而节省时间和精力。
自适应数据采样 Autopilot 可智能地对于对象存储中的文件进行抽样,从而在尽可能减少数据访问量的情况下收集准确的统计信息。MySQL HeatWave 将这些统计信息用于生成和改进查询计划、确定适宜模式映射以及其他用途。
自动加载 Autopilot 会分析数据以预测将其加载到 MySQL HeatWave 中所需的时间、确定数据类型映射,并自动生成加载脚本。用户不必手动指定文件到数据库模式和表的映射。
自适应数据流 MySQL HeatWave Lakehouse 可动态适应底层对象存储的性能。因此,MySQL HeatWave 可充分发掘底层云基础设施的性能,进而提高整体性能、性价比和可用性。
其他增强功能 甲骨文公司宣布推出MySQL HeatWave多项其他增强功能,覆盖机器学习到 VS 代码插件。MySQL HeatWave 的数据库内机器学习功能也已得到进一步增强,添加了对于预测模型的支持。其中添加了新的机器学习解释技术,并且专门针对 MySQL HeatWave 进行了优化。数据科学家现在可以影响自动化 HeatWave ML 训练管道的各个阶段,包括算法选择、特征选择、评分指标和解释技术。HeatWave 机器学习还经过增强,让客户可以将机器学习模型导入 HeatWave。 新的多引擎 Hypergraph 查询优化程序可进一步提高复杂查询的性能,并且不再需要指定联接顺序。新增区域映射,可使用 MySQL HeatWave 为更广泛的查询加速。MySQL 的 VS 代码插件经过增强,可为 MySQL HeatWave 功能提供支持。
错过直播,没关系! 11 月 22 日,甲骨文云技术嘉年华将集中本地化的呈现甲骨文全球云大会 (Oracle CloudWorld) 精华内容给大家。届时,甲骨文中国高管和技术大咖将携手本地优秀客户和合作伙伴为您抽丝剥茧深度解读全球云大会中的前瞻技术成果、云战略布局、创新数据库、极简开发,及如何将客户复杂问题简单化的全球经验。 大咖云集,思想碰撞,一起来探索云端精彩实践。 |
版权所有 @2022 安徽智鑫信息科技有限公司 地址:安徽省合肥市蜀山区青阳北路颐和花园清苑5幢202室 网站备案号:皖ICP备2022013179号-1