Qu’est-ce que SageMaker Lakehouse ?

Amazon SageMaker Lakehouse unifie toutes vos données dans les lacs de données Amazon Simple Storage Service (Amazon S3), y compris les tableaux S3, et les entrepôts de données Amazon Redshift, vous aidant ainsi à créer de puissantes applications d’analytique et d’IA/de ML sur une seule copie des données. SageMaker Lakehouse vous permet d’accéder à vos données et de les interroger sur place grâce à tous les outils et moteurs compatibles avec Apache Iceberg. Sécurisez vos données dans le Lakehouse en définissant des autorisations ultraprécises qui sont appliquées à tous les outils et moteurs d’analytique et de machine learning (ML). Transférez des données provenant de bases de données opérationnelles et d’applications dans votre lakehouse en temps quasi réel grâce à des intégrations zéro ETL. En outre, vous pouvez accéder aux données et les interroger sur place grâce à des fonctionnalités de requêtes fédérées via des sources de données tierces.

Voir Amazon SageMaker à l'œuvre

Découvrez comment accéder à des données unifiées à partir de lacs de données S3, de tableaux S3 et d’entrepôts de données Redshift dans SageMaker Lakehouse.

vignette SageMaker Lakhouse

Avantages

Unifiez toutes vos données dans les lacs de données Amazon S3, y compris les tableaux S3, et les entrepôts de données Amazon Redshift avec SageMaker Lakehouse. Transférez vos données provenant des bases de données opérationnelles et des applications dans le lakehouse en temps quasi réel grâce à des intégrations zéro ETL. Vous pouvez utiliser des centaines de connecteurs pour intégrer des données provenant de différentes sources. Vous pouvez également accéder aux données et les interroger sur place grâce à des fonctionnalités de requêtes fédérées à travers des sources de données tierces.
Utilisez vos outils et moteurs préférés compatibles avec la norme ouverte Apache Iceberg. Bénéficiez de la flexibilité nécessaire pour accéder à vos données et les interroger sur place grâce à tous les outils compatibles avec Apache Iceberg sur une seule copie des données. Compatible avec les spécifications du catalogue Iceberg REST, SageMaker Lakehouse vous permet d’utiliser les outils et moteurs analytiques de votre choix, tels que SQL, Apache Spark, l’informatique décisionnelle (BI) et les outils d’IA/ML, et de collaborer avec les données stockées dans les lacs de données Amazon S3 et les entrepôts de données Amazon Redshift. SageMaker Lakehouse fonctionne avec votre architecture de données existante, ce qui vous permet d'utiliser vos formats de stockage et moteurs de requêtes préférés, compatibles avec Apache Iceberg.
Sécurisez vos données grâce à des contrôles d’accès intégrés et ultraprécis qui sont appliqués à toutes vos données dans tous les outils et moteurs analytiques. Définissez les autorisations une seule fois et partagez les données en toute confiance au sein de votre entreprise.

Cas d'utilisation

Unifiez toutes vos données dans les lacs de données Amazon S3 et les entrepôts de données Amazon Redshift pour vos initiatives d’analytique et d’IA avec une seule copie des données. Grâce à des contrôles d’accès intégrés, SageMaker Lakehouse vous permet de définir des autorisations ultraprécises et de partager en toute sécurité une copie unique des données au sein de toute de l’entreprise.
Accédez à des données en temps quasi réel à travers les bases de données opérationnelles et les applications de SageMaker Lakehouse grâce à des intégrations zéro ETL. Accédez à vos données et interrogez-les sur place, à partir d’un large éventail de services AWS et d’outils et moteurs open source et tiers qui prennent en charge Apache Iceberg.
Importez les données existantes provenant de plusieurs entrepôts de données Amazon Redshift dans SageMaker Lakehouse pour interroger et joindre les données stockées dans des clusters et des groupes de travail Amazon Redshift. Mettez vos charges de travail à échelle pour les processus d’extraction, de transformation et de chargement (ETL), les rapports BI et les analyses selon les besoins sans gérer plusieurs partages de données.

Clients

Lennar

« Nous avons passé les 18 derniers mois à travailler avec AWS pour transformer notre base de données afin d’utiliser les meilleures solutions qui soient également rentables. Grâce à des avancées telles qu’Amazon SageMaker Unified Studio et Amazon SageMaker Lakehouse, nous prévoyons d’accélérer notre rapidité de livraison grâce à un accès fluide aux données et aux services, permettant ainsi à nos ingénieurs, analystes et scientifiques de découvrir des informations qui apportent une valeur significative à notre activité. »

Lee Slezak, vice-président principal des données et de l’analytique chez Lennar

Roche

Roche est un pionnier mondial des produits pharmaceutiques et de diagnostic axés sur le progrès scientifique, dans le but d’améliorer la vie des individus.

« Nous utilisons Amazon Redshift pour obtenir des informations à partir de données structurées et semi-structurées dans tous nos référentiels de données. Le nouvel Amazon SageMaker Lakehouse m’enthousiasme, car il permet d’améliorer et d’unifier l’accès aux lacs de données ou à d’autres sources de données grâce à des services tels qu’Amazon Redshift, le catalogue de données AWS Glue et AWS Lake Formation. Cette innovation permettra à nos équipes de données et d’ingénierie de simplifier l’accès aux données, en favorisant l’interopérabilité entre les charges de travail relatives aux données, aux analytiques et aux applications. Je prévois une réduction notable des erreurs de données grâce à la réduction du nombre de copies de données, à une diminution de 40 % du temps de traitement, à une réécriture plus rapide des données analytiques dans les systèmes transactionnels pour une meilleure prise de décision et à la possibilité pour nos équipes de se concentrer sur la création de valeur commerciale. »

Yannick Misteli, Chef de l’ingénierie, Stratégie globale des produits chez Roche

Roche

Idealista

Idealista soutient les agents immobiliers et les particuliers dans le sud de l’Europe en fournissant une plateforme de petites annonces immobilières en ligne.

« Notre objectif est de rationaliser l’accès aux données Salesforce pour améliorer l’analytique de notre lac de données. En tirant parti de la nouvelle fonctionnalité de prise en charge d’Amazon SageMaker Lakehouse pour les intégrations zéro ETL à partir des applications, nous visons à simplifier nos processus d’extraction et d’ingestion de données, en supprimant la nécessité de recourir à plusieurs ETL pour accéder directement à Salesforce. Cette approche centralisée réduit la complexité et améliore considérablement l'efficacité de notre gestion des données. Nous prévoyons un gain de temps significatif dans le développement de l’extraction et de l’ingestion de données, ce qui permettra à notre équipe de se concentrer sur l’obtention d’informations exploitables à partir de nos données plutôt que sur la gestion de leur collecte. »

Javier Monterrubio, ingénieur responsable de plateformes de données, Idealista

Idealista

Carrier

« Chez Carrier, la nouvelle mouture d’Amazon SageMaker transforme la stratégie de données de notre entreprise en rationalisant la façon dont nous créons et mettons à l’échelle nos produits de données. L’approche de SageMaker Unified Studio en matière de découverte des données, de traitement et de développement de modèles a considérablement accéléré notre implémentation en matière de lakehouse. Plus impressionnant encore, son intégration fluide à notre catalogue de données existant et ses contrôles de gouvernance intégrés nous permettent de démocratiser l’accès aux données tout en maintenant les normes de sécurité, aidant ainsi nos équipes à fournir rapidement des solutions d’analytique avancée et d’IA dans l’ensemble de l’entreprise. »

Carrier

Partenaires

Tableau

Tableau aide les personnes et les organisations à se concentrer davantage sur les données.

« Le partenariat entre Amazon et Salesforce Tableau représente un engagement commun en faveur de l’innovation et de la réussite des clients. Grâce à la nouvelle intégration zéro ETL d’Amazon, nous combinons les données et l’analytique basées sur l’IA de Tableau avec la puissante infrastructure de données d’Amazon afin de transformer la façon dont les entreprises obtiennent des informations à partir de leurs données. Cette intégration transparente permet à nos clients d’obtenir des informations sur toutes leurs données structurées et non structurées en utilisant la puissance d’Amazon SageMaker Lakehouse et d’Amazon Redshift, réduisant ainsi considérablement la complexité de l’ingénierie et le temps de déploiement. Ensemble, Tableau et Amazon aident les clients à accélérer leur transformation numérique et à générer de la valeur commerciale à grande échelle. »

Ali Tore, vice-président principal, Advanced Analytics, Tableau

Tableau

dbt Labs

dbt Labs a pour mission d’aider les analystes à créer et à diffuser des connaissances organisationnelles.

« Nous sommes depuis longtemps la référence en matière de transformation basée sur Amazon Redshift, offrant flexibilité, collaboration et confiance. Avec le nouvel Amazon SageMaker Lakehouse, nous sommes ravis d’étendre cette valeur à un plus grand nombre de clients et à davantage de données dans l’environnement AWS. Les clients peuvent désormais accéder à toutes leurs données via le système AWS, y compris les entrepôts de données et les lacs de données. Nous sommes ravis d’associer nos capacités à celles du nouvel Amazon SageMaker afin d’offrir à nos clients communs des services de gouvernance, de catalogage et d’optimisation des données. »

Shawn Toldo, vice-président des partenariats, dbt Labs

dbt Labs

Informatica

Informatica, leader de la gestion des données dans le cloud basée sur l’IA d’entreprise, donne vie aux données et à l’IA en permettant aux entreprises de tirer parti du pouvoir de transformation de leurs ressources les plus critiques.

« Notre plateforme Intelligent Data Management Cloud (IDMC) et Amazon SageMaker aident les entreprises à exploiter le potentiel de leurs données et à favoriser l’innovation et l’efficacité. En tant que partenaire de lancement d’Amazon SageMaker Lakehouse, nous sommes fiers de proposer une solution professionnelle qui répond aux normes élevées des organisations modernes orientées données. Avec l’infrastructure AWS, nous permettons de prendre des décisions plus rapides et éclairées pour des résultats efficaces dans tous les secteurs. »

Pratik Parekh, vice-président principal de la gestion des produits, Informatica

Informatica