Amazon SageMaker Lakehouse

ลดความซับซ้อนในการวิเคราะห์และ AI ด้วย Data Lakehouse แบบรวมเป็นหนึ่งเดียว เปิดกว้าง และปลอดภัย

SageMaker Lakehouse คืออะไร

Amazon SageMaker Lakehouse รวมข้อมูลทั้งหมดของคุณใน Data Lake ของ Amazon Simple Storage Service (Amazon S3) รวมถึง S3 Tables และคลังข้อมูล Amazon Redshift ซึ่งช่วยให้คุณสร้างการวิเคราะห์และแอปพลิเคชัน AI/ML ที่มีประสิทธิภาพบนสำเนาข้อมูลเดียว SageMaker Lakehouse มอบความยืดหยุ่นในการเข้าถึงและสืบค้นข้อมูลของคุณภายในระบบด้วยเครื่องมือและกลไกที่ใช้งานร่วมกันได้กับ Apache Iceberg ทั้งหมด รักษาความปลอดภัยของข้อมูลใน Lakehouse ได้ด้วยการปรับแต่งสิทธิ์แบบละเอียดที่มีการนำไปใช้กับเครื่องมือและเอ็นจินการวิเคราะห์และแมชชีนเลิร์นนิง (ML) ทั้งหมด นำข้อมูลจากฐานข้อมูลการดำเนินงานและแอปพลิเคชันเข้าสู่ Lakehouse ของคุณแบบใกล้เรียลไทม์ผ่านการบูรณาการ ETL แบบไร้รอยต่อ นอกจากนี้ การเข้าถึงและการสืบค้นข้อมูลยังมีความสามารถในการสืบค้นที่เชื่อมโยงกับส่วนกลางในแหล่งที่มาของข้อมูลจากภายนอก

ดูการทำงาน

ดูวิธีที่คุณสามารถเข้าถึงข้อมูลแบบรวมจาก Data Lake S3, S3 Tables และคลังข้อมูล Redshift ใน SageMaker Lakehouse

ภาพขนาดย่อ SageMaker Lakehouse

ประโยชน์

รวมข้อมูลทั้งหมดจาก Data Lake ของ Amazon S3 รวมถึงตาราง S3 และคลังข้อมูลของ Amazon Redshift เข้าด้วยกันด้วย SageMaker Lakehouse นำข้อมูลของคุณจากฐานข้อมูลการดำเนินงานและแอปพลิเคชันเข้าสู่ Lakehouse ได้แบบแทบจะเรียลไทม์ผ่านการผสานรวม ETL แบบไร้รอยต่อ คุณสามารถใช้ตัวเชื่อมต่อหลายร้อยตัวเพื่อผสานรวมข้อมูลจากแหล่งต่าง ๆ นอกจากนี้ คุณยังสามารถเข้าถึงและสืบค้นข้อมูลในตัวได้ด้วยความสามารถในการสืบค้นที่เชื่อมโยงกับส่วนกลางในแหล่งที่มาของข้อมูลจากภายนอก
ใช้เครื่องมือและกลไกที่คุณต้องการเข้ากันได้กับมาตรฐานเปิด Apache Iceberg เพิ่มความยืดหยุ่นในการเข้าถึงและสืบค้นข้อมูลในตัวด้วยเครื่องมือที่ใช้งานร่วมกันได้กับ Apache Iceberg ทั้งหมดในสำเนาข้อมูลเดียว SageMaker Lakehouse เข้ากันได้กับข้อมูลจำเพาะแคตตาล็อก Iceberg REST ให้คุณใช้เครื่องมือวิเคราะห์และกลไกที่คุณเลือก เช่น SQL, Apache Spark, business intelligence (BI) และเครื่องมือ AI/ML และทำงานร่วมกับข้อมูลที่เก็บไว้ใน Data Lake Amazon S3 และคลังข้อมูล Amazon Redshift SageMaker Lakehouse ใช้ได้กับสถาปัตยกรรมข้อมูลที่มีอยู่ ช่วยให้คุณสามารถใช้รูปแบบการจัดเก็บข้อมูลและเครื่องมือสืบค้นที่คุณต้องการได้ ซึ่งสามารถใช้งานร่วมกันได้กับ Apache Iceberg
รักษาความปลอดภัยให้ข้อมูลของคุณด้วยการควบคุมสิทธิ์การเข้าถึงแบบละเอียดที่ผสานรวม ซึ่งมีการบังคับใช้ในข้อมูลทั้งหมดของคุณในเครื่องมือและเอนจินการวิเคราะห์ทั้งหมด กำหนดสิทธิ์เพียงครั้งเดียวแล้วแชร์ข้อมูลในองค์กรของคุณอย่างมั่นใจ

กรณีใช้งาน

รวมข้อมูลทั้งหมดของคุณใน Data Lake ของ Amazon S3 และคลังข้อมูล Amazon Redshift เพื่อการวิเคราะห์และการความคิดริเริ่มด้าน AI ด้วยสำเนาข้อมูลเดียว ด้วยระบบควบคุมสิทธิ์การเข้าถึงแบบผสานรวม SageMaker Lakehouse ช่วยให้คุณสามารถกำหนดสิทธิ์แบบละเอียดและแชร์สำเนาข้อมูลเดียวได้อย่างปลอดภัยทั่วทั้งองค์กร
เข้าถึงข้อมูลในฐานข้อมูลการดำเนินงานและแอปพลิเคชันแบบแทบจะเรียลไทม์ใน SageMaker Lakehouse ผ่านการบูรณาการ ETL แบบไร้รอยต่อ เข้าถึงและสืบค้นข้อมูลของคุณในตัวจากบริการ AWS ที่หลากหลาย รวมถึงเครื่องมือและเอนจินแบบโอเพนซอร์สและจากภายนอกที่รองรับ Apache Iceberg
นำข้อมูลที่มีอยู่จากคลังข้อมูลของ Amazon Redshift หลายแห่งเข้าสู่ SageMaker Lakehouse เพื่อสืบค้นและรวมข้อมูลที่เก็บไว้ในคลัสเตอร์และเวิร์กกรุ๊ป Amazon Redshift ปรับขนาดเวิร์กโหลดของคุณสำหรับกระบวนการ Extract, Transform and Load (ETL), การรายงาน BI และการวิเคราะห์ตามความจำเป็นโดยไม่ต้องจัดการการแชร์ข้อมูลหลายรายการ

ลูกค้า

Lennar

"เราใช้เวลา 18 เดือนที่ผ่านมาทำงานร่วมกับ AWS เพื่อเปลี่ยนรากฐานข้อมูลของเราเป็นโซลูชันที่ดีที่สุดและคุ้มค่าด้วย ความก้าวหน้าอย่างสตูดิโอแบบครบวงจรของ Amazon SageMaker และ Amazon SageMaker Lakehouse เราเร่งความเร็วในการส่งมอบผ่านการเข้าถึงข้อมูลและบริการได้อย่างราบรื่น ซึ่งเปิดโอกาสให้วิศวกร นักวิเคราะห์ และนักวิทยาศาสตร์ของเราสามารถค้นหาข้อมูลเชิงลึกที่มอบค่านิยมทางวัตถุให้กับธุรกิจของเรา"

Lee Slezak รองประธานอาวุโสฝ่ายข้อมูลและการวิเคราะห์ของ Lennar

Roche

Roche เป็นผู้บุกเบิกระดับโลกด้านเภสัชกรรมและการวินิจฉัยที่มุ่งเน้นไปที่การพัฒนาวิทยาศาสตร์เพื่อปรับปรุงคุณภาพชีวิตของผู้คน

“เราใช้ Amazon Redshift เพื่อรับข้อมูลเชิงลึกจากข้อมูลทั้งแบบมีโครงสร้างและแบบกึ่งมีโครงสร้างในทั่วทุกที่เก็บข้อมูลของเรา Amazon SageMaker Lakehouse ใหม่ทำให้ผมรู้สึกตื่นเต้นไปกับศักยภาพในการปรับปรุงและรวมการเข้าถึง Data Lake หรือแหล่งที่มาของข้อมูลอื่น ๆ ให้เป็นหนึ่งเดียวด้วยบริการอย่าง Amazon Redshift, แค็ตตาล็อกข้อมูลของ AWS Glue และ AWS Lake Formation นวัตกรรมนี้จะช่วยให้ทีมข้อมูลและวิศวกรรมของเราสามารถลดความซับซ้อนในการเข้าถึงข้อมูล ส่งเสริมการทำงานร่วมกันระหว่างข้อมูล การวิเคราะห์ และเวิร์กโหลดแอปพลิเคชัน ฉันคาดการณ์ว่าข้อผิดพลาดของข้อมูลจะลดลงอย่างเห็นได้ชัดด้วยการคัดลอกข้อมูลน้อยลง โดยเวลาในการประมวลผลลดลงถึง 40% การเขียนข้อมูลการวิเคราะห์กลับไปยังระบบธุรกรรมได้เร็วขึ้นเพื่อการตัดสินใจที่ดียิ่งขึ้น และทำให้ทีมของเราสามารถโฟกัสไปที่การสร้างมูลค่าทางธุรกิจได้”

Yannick Misteli หัวหน้าฝ่ายวิศวกรรมประจำแผนกกลยุทธ์ผลิตภัณฑ์ระดับโลกของ Roche

Roche

Idealista

Idealista สนับสนุนตัวแทนอสังหาริมทรัพย์และบุคคลธรรมดาทั่วยุโรปตอนใต้โดยจัดหาแพลตฟอร์มโฆษณาอสังหาริมทรัพย์ออนไลน์

“เป้าหมายของเราคือการเพิ่มประสิทธิภาพการเข้าถึงข้อมูล Salesforce เพื่อการวิเคราะห์ที่ดียิ่งขึ้นใน Data Lake ของเรา เราใช้ประโยชน์จากการสนับสนุน Amazon SageMaker Lakehouse ใหม่สำหรับการบูรณาการ ETL แบบไร้รอยต่อจากฟีเจอร์แอปพลิเคชัน เราสามารถจะทำให้กระบวนการแยกข้อมูลและการนำข้อมูลเข้าง่ายขึ้นเพื่อขจัดความจำเป็นในการใช้ ETL หลายรายการในการเข้าถึง Salesforce โดยตรง แนวทางแบบรวมศูนย์นี้ไช่วยลดความซับซ้อนเท่านั้น และยังช่วยปรับปรุงประสิทธิภาพการจัดการข้อมูลของเราได้อย่างมีนัยสำคัญด้วย เราคาดว่าจะประหยัดเวลาในการดึงข้อมูลและการพัฒนาการนำข้อมูลเข้าได้เป็นอย่างมาก ซึ่งจะทำให้ทีมของเราสามารถมุ่งเน้นไปที่การรับข้อมูลเชิงลึกที่สามารถดำเนินการได้จากข้อมูลของเราแทนที่จะต้องจัดการกับการเก็บรวบรวมข้อมูล”

Javier Monterrubio ผู้จัดการวิศวกรแพลตฟอร์มข้อมูลของ Idealista

Idealista

Carrier

"ที่ Carrier ซอฟต์แวร์ Amazon SageMaker รุ่นถัดไปกำลังเปลี่ยนแปลงกลยุทธ์ข้อมูลองค์กรของเราโดยปรับปรุงวิธีการสร้างและปรับขนาดผลิตภัณฑ์ข้อมูล" แนวทางของ SageMaker Unified Studio ในการค้นพบข้อมูล การประมวลผล และการพัฒนาแบบจำลองช่วยเร่งการใช้งาน Lakehouse ของเราได้อย่างมาก ที่น่าประทับใจที่สุดคือการผสานรวมที่ราบรื่นกับแคตตาล็อกข้อมูลที่มีอยู่และการควบคุมการกำกับดูแลในตัวช่วยให้เรากระจายการเข้าถึงข้อมูลได้อย่างเท่าเทียมกันในขณะที่ยังคงมาตรฐานความปลอดภัยไว้ ช่วยให้ทีมงานของเราส่งมอบการวิเคราะห์ขั้นสูงและโซลูชัน AI ทั่วทั้งองค์กรได้อย่างรวดเร็ว"

Carrier

พันธมิตร

Tableau

Tableau ช่วยให้ผู้คนและองค์กรสามารถขับเคลื่อนด้วยข้อมูลได้มากขึ้น

“ความร่วมมือระหว่าง Amazon และ Salesforce Tableau แสดงถึงความมุ่งมั่นที่มีร่วมกันต่อนวัตกรรมและความสำเร็จของลูกค้า เรากำลังผสมผสานข้อมูลและการวิเคราะห์ที่ขับเคลื่อนด้วย AI ของ Tableau เข้ากับโครงสร้างพื้นฐานข้อมูลอันทรงพลังของ Amazon เพื่อเปลี่ยนวิธีที่องค์กรรับข้อมูลเชิงลึกจากข้อมูลของตนเอง โดยผ่านการบูรณาการ ETL แบบไร้รอยต่อใหม่ของ Amazon การบูรณาการที่ราบรื่นนี้จะช่วยให้ลูกค้าของเราได้รับข้อมูลเชิงลึกจากข้อมูลทั้งหมดของตนเองทั้งแบบมีโครงสร้างและไม่มีโครงสร้าง โดยใช้ประสิทธิภาพของ Amazon SageMaker Lakehouse และ Amazon Redshift ซึ่งจะลดความซับซ้อนทางวิศวกรรมและเวลาในการนำไปใช้จริงได้อย่างมาก Tableau และ Amazon ร่วมกันช่วยให้ลูกค้าสามารถเร่งการเปลี่ยนผ่านสู่ระบบดิจิทัลและขับเคลื่อนมูลค่าทางธุรกิจได้ในวงกว้าง“

Ali Tore รองประธานอาวุโส ฝ่ายวิเคราะห์ขั้นสูงของ Tableau

Tableau

dbt Labs

dbt Labs มีพันธกิจที่จะช่วยให้นักวิเคราะห์สามารถสร้างและเผยแพร่ความรู้ขององค์กรได้

"เราเป็นมาตรฐานการเปลี่ยนแปลงที่เพิ่มเติมจาก Amazon Redshift มานานแล้ว เรานำเสนอความยืดหยุ่น ความร่วมมือ และความน่าเชื่อถือ Amazon SageMaker Lakehouse ใหม่ ทำให้เรารู้สึกตื่นเต้นที่จะได้ขยายคุณค่านี้ให้กับลูกค้าจำนวนมากขึ้นหรือแม้แต่ข้อมูลปริมาณมากขึ้นในสภาพแวดล้อม AWS ตอนนี้ลูกค้าสามารถเข้าถึงข้อมูลทั้งหมดของตนเองในทั่วทั้งระบบ AWS รวมถึงคลังข้อมูลและ Data Lake เรารู้สึกตื่นเต้นที่จะได้นำความสามารถของเราเข้าร่วมกับ Amazon SageMaker ใหม่ เพื่อส่งมอบการกำกับดูแล การจัดแค็ตตาล็อก และการเพิ่มประสิทธิภาพข้อมูลให้กับลูกค้าร่วมของเรา”

Shawn Toldo รองประธานฝ่ายความร่วมมือของ dbt Labs

dbt Labs

Informatica

Informatica ผู้นำด้านการจัดการข้อมูลบนคลาวด์ที่ขับเคลื่อนด้วย AI สำหรับองค์กรใช้ประโยชน์จากข้อมูลและ AI โดยการเสริมศักยภาพให้ธุรกิจตระหนักถึงพลังการเปลี่ยนแปลงของสินทรัพย์ที่สำคัญที่สุดของตน

“แพลตฟอร์ม Intelligent Data Management Cloud (IDMC) ของเราและ Amazon SageMaker ช่วยให้องค์กรสามารถปลดล็อกศักยภาพของข้อมูลและขับเคลื่อนนวัตกรรมและประสิทธิภาพ ในฐานะพาร์ทเนอร์เปิดตัว Amazon SageMaker Lakehouse เราภูมิใจที่ได้ส่งมอบโซลูชันระดับองค์กรที่ตรงตามมาตรฐานสูงขององค์กรที่ขับเคลื่อนด้วยข้อมูลที่ทันสมัย เมื่อทำงานร่วมกับโครงสร้างพื้นฐานของ AWS เราสามารถช่วยให้ตัดสินใจได้อย่างมีข้อมูลและรวดเร็วขึ้น เพื่อให้ได้ผลลัพธ์ที่ส่งผลทั่วทั้งอุตสาหกรรม”

Pratik Parekh รองประธานอาวุโส (SVP) ฝ่ายการจัดการผลิตภัณฑ์ของ Informatica

Informatica