Star Schema là gì? Phân biệt Star và Snowflake Schema 

19/05/2025   |   Tran Van Dao

Star Schema là gì? Phân biệt Star Schema và Snowflake Schema 

Fact Tables là gì? 

Trong mô hình cơ sở dữ liệu quan hệ, Fact Table (Bảng sự kiện) là bảng chính trong hệ thống lưu trữ dữ liệu dạng Star schema. Fact Table chứa các dữ liệu định lượng dùng để phân tích, chẳng hạn như doanh thu, lợi nhuận, số lượng bán hàng,… 

Fact Tables là gì ?

Fact Tables là gì ?

Đặc điểm của Fact Table: 

  • Chứa các measure – giá trị số liệu cần phân tích. 
  • Có khóa ngoại liên kết với các bảng dimension. 
  • Có thể chứa dữ liệu giao dịch thô hoặc dữ liệu đã được tổng hợp. 

Ví dụ, một bảng Fact về bán hàng có thể bao gồm: 

  • Order_ID 
  • Customer_ID (khóa ngoại đến bảng Dimension khách hàng) 
  • Product_ID (khóa ngoại đến bảng Dimension sản phẩm) 
  • Quantity_Sold 
  • Total_Amount 

Dimension Tables là gì? 

Dimension Table (Bảng chiều) chứa thông tin mô tả về các khía cạnh khác nhau của dữ liệu trong Fact Table. 

Đặc điểm của Dimension Table: 

  • Chứa dữ liệu mô tả như tên khách hàng, khu vực, tên sản phẩm, loại sản phẩm,… 
  • Thường chứa ít bản ghi hơn so với Fact Table. 
  • Giúp người dùng hiểu được “ngữ cảnh” của số liệu trong Fact Table. 

Ví dụ bảng Dimension về sản phẩm có thể bao gồm: 

  • Product_ID 
  • Product_Name 
  • Category 
  • Brand 

Star Schema là gì? 

Star Schema (hay còn gọi là Lược đồ ngôi sao) là một mô hình thiết kế cơ sở dữ liệu trong kho dữ liệu (Data Warehouse), trong đó một bảng Fact nằm ở trung tâm và liên kết trực tiếp đến các bảng Dimension xung quanh. 

Star Schema là gì ?

Star Schema là gì ?

Cấu trúc: 

  • Một bảng Fact trung tâm 
  • Nhiều bảng Dimension liên kết trực tiếp 

Hình dạng của lược đồ giống như một ngôi sao, từ đó có tên gọi “Star Schema”. 

Ưu điểm của Star Schema 

Hiệu suất truy vấn 

  • Do các bảng dimension không bị phân mảnh, truy vấn dữ liệu diễn ra nhanh hơn. 
  • Hệ thống có thể dễ dàng tạo các chỉ mục tối ưu hóa. 

Tải hiệu suất và quản trị 

  • Dễ dàng trong việc tải dữ liệu từ hệ thống OLTP. 
  • Không yêu cầu quá nhiều phép JOIN phức tạp. 
  • Quản trị mô hình đơn giản và dễ bảo trì. 

Tính toàn vẹn tham chiếu được tích hợp sẵn 

  • Các bảng Dimension có thể dễ dàng liên kết bằng khóa chính – khóa ngoại. 
  • Tăng tính toàn vẹn dữ liệu khi phân tích. 

Được hiểu dễ dàng 

  • Giao diện trực quan giúp người dùng cuối, nhà phân tích dữ liệu hiểu nhanh cấu trúc. 
  • Dễ triển khai trong các công cụ BI như Power BI, Tableau. 

Nhược điểm của Star Schema 

  • Khó mở rộng nếu dữ liệu có cấu trúc phân cấp phức tạp. 
  • Dữ liệu dư thừa trong Dimension Table có thể khiến kho dữ liệu chiếm nhiều không gian lưu trữ. 
  • Thiếu tính linh hoạt nếu cần liên kết nhiều mức phân cấp. 

Snowflake Schema là gì? 

Snowflake Schema là phiên bản mở rộng của Star Schema, trong đó các Dimension Table được phân tách thành các bảng nhỏ hơn để chuẩn hóa dữ liệu. 

Snowflake schema là gì ?

Snowflake schema là gì ?

Cấu trúc: 

  • Một bảng Fact ở trung tâm 
  • Các bảng Dimension phân tách thành nhiều bảng con theo cấp độ phân cấp 

Điều này tạo ra hình dạng giống như bông tuyết – vì thế có tên gọi Snowflake Schema. 

Ví dụ về Snowflake Schema 

Giả sử bạn có bảng Dimension sản phẩm. Trong Star Schema, toàn bộ thông tin sản phẩm nằm trong một bảng. Nhưng trong Snowflake Schema: 

  • Product Table: Product_ID, Product_Name, Category_ID 
  • Category Table: Category_ID, Category_Name, Department_ID 
  • Department Table: Department_ID, Department_Name 

Lợi thế của Snowflake Schema 

  • Chuẩn hóa dữ liệu: giảm thiểu dữ liệu dư thừa, tăng hiệu quả lưu trữ. 
  • Tính toàn vẹn dữ liệu cao hơn: dễ kiểm soát và cập nhật khi có thay đổi. 
  • Phù hợp với dữ liệu có cấu trúc phân cấp phức tạp. 

Nhược điểm của Snowflake Schema 

  • Hiệu suất thấp hơn: do yêu cầu nhiều phép JOIN hơn khi truy vấn. 
  • Khó hiểu hơn với người dùng không chuyên kỹ thuật. 
  • Khó thiết lập trên các công cụ phân tích dữ liệu không hỗ trợ tốt mô hình phức tạp. 

Phân biệt giữa Star Schema và Snowflake Schema 

So sánh Star schema và Snowflake schema

So sánh Star schema và Snowflake schema

Tiêu chí  Star Schema  Snowflake Schema 
Cấu trúc  Đơn giản, bảng dimension không chuẩn hóa  Phức tạp hơn, bảng dimension được chuẩn hóa 
Hiệu suất truy vấn  Tốt hơn do ít phép JOIN  Kém hơn vì cần nhiều phép JOIN 
Dễ sử dụng  Thân thiện với người dùng cuối  Khó hiểu hơn đối với người không chuyên 
Dung lượng lưu trữ  Tốn dung lượng hơn do dư thừa dữ liệu  Tiết kiệm dung lượng hơn nhờ chuẩn hóa dữ liệu 
Khả năng mở rộng  Hạn chế trong trường hợp dữ liệu phân cấp  Mở rộng linh hoạt theo nhiều cấp độ phân cấp 

Kết luận

Việc lựa chọn giữa Star SchemaSnowflake Schema phụ thuộc vào nhu cầu cụ thể của doanh nghiệp và hệ thống phân tích dữ liệu. Star Schema phù hợp với tốc độ truy vấn cao, dễ sử dụng cho người dùng cuối, trong khi Snowflake Schema lý tưởng cho các hệ thống dữ liệu phức tạp và yêu cầu tối ưu lưu trữ. 

Công ty cổ phần công nghệ Bách Hưng Khang tự hào là đối tác đáng tin cậy trong lĩnh vực Công nghệ thông tin cho các doanh nghiệp vừa và nhỏ Việt Nam

Công ty cổ phần công nghệ Bách Hưng Khang tự hào là đối tác đáng tin cậy trong lĩnh vực Công nghệ thông tin cho các doanh nghiệp vừa và nhỏ Việt Nam

Công ty BHK với kinh nghiệm triển khai giải pháp dữ liệu cho doanh nghiệp, luôn sẵn sàng hỗ trợ bạn thiết kế Data Warehouse tối ưu, lựa chọn mô hình phù hợp để giúp hoạt động phân tích dữ liệu trở nên hiệu quả hơn, đừng ngần ngại liên hệ với BHK để được tư vấn mô hình dữ liệu phù hợp nhất! 

 

ĐỌC THÊM:

Vai Trò Của Phân Tích Dữ Liệu Trong Tối Ưu Hóa Quy Trình

Top 10+ Hệ Thống CRM Hiệu Quả Cho Doanh Nghiệp

Tối Ưu Data Model Gia Tăng Hiệu Suất Power BI

10 Hàm Date Formulas Cơ Bản Trong Power BI DAX 

Chuẩn Hóa Cơ Sở Dữ Liệu – Định Nghĩa và Phân Loại

Prompt Copilot: Công cụ AI tối ưu hóa quy trình làm việc

Hotline

0833 052 299

Đối tác

BHK