亚马逊云科技在2023 re:Invent全球大会上,宣布推出一系列新的集成解决方案,旨在帮助客户迅速而轻松地连接和分析数据,而无需构建和管理复杂的提取、转换和加载(ETL)数据管道。通过全新的Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon Relational Database Service(Amazon RDS)for MySQL与Amazon Redshift的Zero-ETL集成特性,使得在Amazon Redshift中连接和分析多个关系型和非关系型数据库的数据变得更加容易。此外,客户现在还可以使用Amazon OpenSearch Service对Amazon DynamoDB数据进行近乎实时的全文和向量搜索。无论数据存储在哪里,这些Zero-ETL集成特性都能简化数据连接和操作流程,使客户灵活地利用亚马逊云科广泛而领先的数据库和分析服务,深入挖掘新洞见的同时更迅速地实现创新并做出更明智的数据驱动决策。
“为了帮助客户通过数据激发创新,亚马逊云科技提供了广泛而深入的数据服务,用于大规模存储和查询各种类型的数据。”亚马逊云科技数据与人工智能副总裁Swami Sivasubramanian博士表示,“客户除了要有适合工作的正确工具之外,还需要具备在企业范围内集成数据的能力,从而创造更多业务价值并实现更快速地创新。这也是我们投资Zero-ETL未来的原因,让数据集成不再是繁琐的手动任务,使客户能够轻松获取他们所需的数据。今天宣布的新的集成特性是我们迈向Zero-ETL未来的重要一步,而且亚马逊云科技还将持续投资于这一愿景,让客户能够轻松集成来自整个系统的数据,从而专注于发现新的洞见。”
数据是企业的独特竞争力。企业拥有不同类型的数据,它们的来源不同,规模和产生速度各异,用途也是千差万别。为了最大程度利用数据,企业需要一套全面的工具来处理各种变量,以及集成和合并分散在多个来源的数据。例如,一家企业可能在关系型数据库中存储交易数据并希望在数据仓库中进行分析,但同时还需要使用另一种分析工具对非关系型数据库的数据进行向量搜索。在过去,移动数据通常需要企业构建自己的ETL数据管道,但这样做不仅成本高昂、管理复杂且容易发生间歇性错误,导致无法及时获得本来需要快速获取的洞见。为了帮助客户充分挖掘数据价值,亚马逊云科技提供了一套全面的数据服务,确保客户始终拥有正确的工具。但是将数据作为业务核心还有一个关键环节,就是客户要能够连接所有数据,无论它们存储在何处。
这正是亚马逊云科技投资Zero-ETL功能的原因,消除了手动移动数据的负担,包括Amazon Redshift和Amazon Athena中的联邦查询功能,使客户能够直接查询存储在操作型数据库、数据仓库和数据湖中的数据,例如Amazon Connect分析数据湖,使客户能够更轻松地访问联络中心的数据进行分析和机器学习。同时,还有全新的Salesforce Data Cloud与亚马逊云科技存储、数据和分析服务之间的Zero-ETL集成,让客户能够在Salesforce和亚马逊云科技之间轻松无缝地统一数据,从而更快速地获得全面的洞察。基于亚马逊云科技Zero-ETL,今天宣布的集成功能消除了构建和维护数据管道的负担,让客户能够快速、轻松地连接所有数据,无论它们存储在何处。
· 全新的Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon RDS for MySQL与Amazon Redshift的Zero-ETL集成,极大简化了分析交易数据的过程,无需构建和维护数据管道:为了充分挖掘数据价值,许多企业希望将来自多个高性能数据库的交易数据(包括Amazon Aurora和Amazon RDS等关系型数据库,以及Amazon DynamoDB等非关系型数据库)迁移到Amazon Redshift等数据仓库中,以运行大规模数据仓库和高性能分析工作负载。然而,这种数据迁移的过程通常要求企业为每个数据源建立ETL管道。为了更容易地使用Amazon Redshift分析Amazon Aurora数据,亚马逊云科技在今年早些时候宣布了Aurora MySQL与Amazon Redshift的Zero-ETL集成正式可用。该集成每分钟处理超过100万次交易,并在Amazon Aurora MySQL中写入数据后的几秒内提供给Amazon Redshift使用。为了进一步拓展Zero-ETL优势,亚马逊云科技现在宣布针对Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon RDS for MySQL与Amazon Redshift的新Zero-ETL集成的预览版正式可用。这些集成有助于客户快速、轻松地访问Amazon Redshift中常用的关系型和非关系型数据库的数据,进行全面的分析。客户只需在数据库中选择包含所需数据的数据表,数据便会自动复制到Amazon Redshift。通过将不同数据源的数据整合到一个数据仓库中,客户可以获得对业务的综合视图,并充分利用Amazon Redshift的高级功能,包括数据共享、物化视图和Amazon Redshift ML等,获取全面且具有预测性的洞察。
· Amazon DynamoDB与Amazon OpenSearch Service的Zero-ETL集成,能够近乎实时地对交易数据进行全文和向量搜索:为了优化业务运营并提升用户体验,许多客户使用Amazon OpenSearch Service对Amazon DynamoDB中的交易数据执行高级搜索功能,如全文和向量搜索、相关性排名和自动完成建议。例如,一家电商公司可能会将数据从Amazon DynamoDB复制到Amazon OpenSearch Service,利用向量搜索并通过与类似交易的数据进行比较后,自动判断交易是否存在欺诈行为。如今,全新的Amazon DynamoDB与Amazon OpenSearch Service的Zero-ETL集成已全面可用,客户能够更轻松地在几乎实时的情况下对Amazon DynamoDB数据进行强大的全文和向量搜索查询。客户只需选择包含他们想要分析的数据的Amazon DynamoDB表,数据将在写入DynamoDB后的几秒钟内便会被复制到Amazon OpenSearch Service中。客户可以将多个Amazon DynamoDB表中的数据同步到一个Amazon OpenSearch Service托管集群或无服务器集合中,以获取跨多个应用程序的全面洞察,还能整合搜索资产,在提高运营效率的同时降低成本。
美国联合航空公司运营着一个庞大的国内和国际航线网络,覆盖了美国各个城市。“如今,我们使用Amazon RDS和Amazon Redshift等亚马逊云科技服务收集和分析来自应用程序、客户和运营团队的数据。然而,手动管理全球范围内所有数据的数据管道需要耗费大量的人力和成本。”美国联合航空公司董事总经理Sanjay Nair表示,“通过Amazon RDS for MySQL与Amazon Redshift的Zero-ETL集成,我们计划构建具备自我修复能力的数据管道以自动管理灾难恢复、管道和数据质量功能,同时减轻数据工程师的负担。我们还将利用强大的Amazon Redshift功能,如跨区域数据共享、Amazon Redshift Serverless和Amazon Redshift Spectrum服务来帮助我们解锁Amazon RDS for MySQL的数据洞察力。”
人才招聘技术提供商iCIMS专注于让每个企业都能够招聘到优秀的人才。“我们一直希望借助亚马逊云科技的力量,利用专门构建的数据存储,以及几乎无需维护且高效可扩展的数据共享和提取过程,来构建一种有效的、现代的数据策略,助力我们实现应用程序现代化。”iCIMS云托管和工程副总裁Ben Barresi表示,“我们期待使用Amazon Aurora PostgreSQL与Amazon Redshift的Zero-ETL集成,来减轻工程团队在数据获取管道管理和维护方面的负担。数据在Amazon Aurora中写入后的几秒内就可以在Amazon Redshift中使用,与我们目前每晚运行的批量处理提取相比,数据分析速度将得到显著提升。“
本文由 计算杂谈 作者:云中子 发表,转载请注明来源!