Redshift nghĩa là gì

Khi nói đến các dịch vụ điện toán đám mây, Amazon Redshift là một cường quốc về lưu trữ dữ liệu. Kho dữ liệu được sử dụng bởi một số công ty lớn nhất trên thế giới, bao gồm Ford Motor Company, Lyft, Intuit và Pfizer. Ngoài ra, kho dữ liệu lưu trữ cơ sở dữ liệu đám mây và dữ liệu sản xuất liên quan. Khái niệm dữ liệu lớn phụ thuộc vào khả năng xử lý, lưu trữ và phân tích dữ liệu trong kho bạc lớn và đó chính xác là những gì Amazon Redshift cung cấp.

Giống như không có sản phẩm nào khác, Amazon Redshift đã thúc đẩy việc áp dụng dữ liệu và lưu trữ dữ liệu lớn, cho phép các công ty xây dựng các ứng dụng mạnh mẽ và tạo các báo cáo có chứa tất cả dữ liệu họ cần để điều hành doanh nghiệp. sản phẩm kho dữ liệu nhanh chóng và toàn diện. Một khi bạn hiểu các điều khoản, bạn có thể tìm hiểu về lợi ích của sản phẩm.

Khái niệm cơ bản về kho dữ liệu

Một trong những điều đầu tiên bạn nên biết về Amazon Redshift là bạn có thể bắt đầu nhỏ. Mỗi công ty có thể đăng nhập vào một nút, nơi bạn lưu trữ cơ sở dữ liệu và dữ liệu của nó, sau đó chạy truy vấn và báo cáo về dữ liệu đó [và chạy các ứng dụng tùy chỉnh của riêng bạn]. Nút đầu tiên bạn tạo được gọi là nút lãnh đạo. Nếu bạn thêm nhiều hơn, chúng được gọi là các nút tính toán. Bạn có thể định nghĩa Amazon Redshift là một cụm các nút.

Tất nhiên, nó phức tạp hơn nhiều – Redshift là nền tảng cho một bộ sưu tập các sản phẩm điện toán đám mây là một phần của Dịch vụ web Amazon. Thành phần lưu trữ đám mây có Amazon S3 [hoặc Amazon Simple Storage Service], cung cấp chính kho lưu trữ đối tượng.

Tuy nhiên, nhiều công ty bắt đầu với một nút khi họ bắt đầu một sáng kiến ​​lưu trữ dữ liệu. Khi các yêu cầu lưu trữ dữ liệu của bạn mở rộng và thay đổi, bạn có thể thêm nhiều nút vào một cụm. Điều này sẽ cho phép bạn xây dựng nhiều ứng dụng hơn, chạy nhiều truy vấn hơn và phân tích nhiều hơn. Giá cả có thể phụ thuộc vào thời gian bạn muốn giữ cho các nút này hoạt động. Giá sẽ giảm nếu bạn dự trữ các nút trong một khoảng thời gian dài hơn, ví dụ. Trong một hoặc ba năm.

Điều quan trọng nữa là phải biết rằng hầu hết sự phức tạp nằm ở phía sau hậu trường. Điều này bao gồm bảo mật điểm cuối, quản trị, nhân rộng, triển khai và mọi thứ khác liên quan đến kho dữ liệu. Có bảng điều khiển web cho phép nhóm quản lý dịch vụ CNTT của bạn quản lý các phiên bản và tạo các nút mới. Tuy nhiên, bạn không cần lập kế hoạch hoặc quản lý các tính năng, sao lưu, lưu trữ hoặc quản lý cơ sở hạ tầng cho cơ sở dữ liệu hoặc dữ liệu, bao gồm cả máy chủ hoặc mạng.

Amazon gần đây đã công bố một số cải tiến cho Redshift. Một trong những thay đổi quan trọng nhất là các nút bạn sử dụng cho hiệu suất hoặc lưu trữ có thể được điều chỉnh riêng. Trước đây, một cụm được quản lý cho cả phân bổ hiệu năng và bộ nhớ. Amazon cũng cải thiện tốc độ mạng, đặc biệt là các kết nối giữa Redshift và Amazon S3. Amazon tuyên bố rằng Redshift hiện cung cấp hiệu suất gấp ba lần các sản phẩm kho dữ liệu cạnh tranh.

Lợi ích của Redshift

Giống như bất kỳ sáng kiến ​​điện toán đám mây nào, lý do sử dụng Amazon Redshift phải được thực hiện với tính linh hoạt. Như đã đề cập trước đó, các công ty có thể đặt một nút làm điểm bắt đầu. Tuy nhiên, từ đó, họ có thể tạo các cụm lớn với nhiều nút cho mỗi nhu cầu báo cáo mà họ có cho bất kỳ ứng dụng web nào. Có thể nói rằng khả năng kiểm soát cơ sở dữ liệu là vô tận không hoàn toàn đúng, nhưng điện toán đám mây sẽ trông như thế.

Một lợi ích khác vượt xa sự linh hoạt về những gì bạn có thể làm và các ứng dụng bạn chạy cũng là một lợi thế của cách mọi thứ được quản lý. Nhân viên CNTT của bạn không cần quản lý cơ sở hạ tầng điện toán đám mây hoặc các máy chủ, mạng hoặc lưu trữ được yêu cầu. Vì mọi thứ đều ở trên đám mây và là một phần của Dịch vụ web Amazon [hoặc AWS], mọi thứ đều được quản lý từ xa và tự động cập nhật.

Một lợi ích cuối cùng cần xem xét là Amazon Redshift cung cấp khuôn khổ cho một doanh nghiệp vượt qua các giới hạn hiện tại. Đây có thể là một ứng dụng mới sử dụng cơ sở dữ liệu trong đám mây [và dữ liệu được lưu trữ trên đám mây] hoặc một cách mới để phân tích dữ liệu kinh doanh. Một số công ty thậm chí còn tạo ra các phòng ban và bộ phận hoàn toàn mới dựa trên khả năng hiểu và xử lý dữ liệu mới được phát hiện của họ. Một ví dụ về điều này có thể là một nhà sản xuất ô tô có thể phân tích dữ liệu trong thời gian thực và phát triển các chức năng lái xe tự trị.

Cuối cùng, sức mạnh của Amazon Redshift chỉ bị giới hạn bởi trí tưởng tượng của công ty để bắt đầu một doanh nghiệp mới, chủ động, phát triển một sản phẩm mới hoặc bắt đầu một bộ phận mới.

Bài này chúng ta sẽ tìm hiểu về Redshift là gì? trong AWS, trước khi chúng ta bắt đầu sử dụng AWS một cách dễ dàng hơn.

  • Redshift là một dịch vụ kho dữ liệu quy mô petabyte nhanh và mạnh, được quản lý hoàn toàn trên đám mây.
  • Khách hàng có thể sử dụng Redshift chỉ với 0,25 đô la mỗi giờ mà không cần cam kết hoặc trả trước chi phí và mở rộng quy mô đến một petabyte hoặc hơn với 1.000 đô la mỗi terabyte mỗi năm.

OLAP

OLAP là Hệ thống xử lý phân tích trực tuyến được Redshift sử dụng .

Ví dụ về giao dịch OLAP:

Giả sử chúng ta muốn tính toán Lợi nhuận ròng cho EMEA và Pacific cho Sản phẩm Radio kỹ thuật số. Điều này đòi hỏi phải kéo một số lượng lớn các bản ghi. Sau đây là các bản ghi cần thiết để tính Lợi nhuận ròng:

  • Tổng số Radios được bán trong EMEA.
  • Tổng số Radios được bán tại Thái Bình Dương.
  • Đơn giá của đài từng vùng.
  • Giá bán của mỗi đài
  • Giá bán – đơn giá

Các truy vấn phức tạp được yêu cầu để tìm nạp các bản ghi đã cho ở trên. Cơ sở dữ liệu Kho dữ liệu sử dụng kiến ​​trúc kiểu khác nhau cả từ góc độ cơ sở dữ liệu và lớp cơ sở hạ tầng.

2. Cấu hình Redshift

Dịch chuyển đỏ bao gồm hai loại nút:

  • Một nút[Single node]
  • Nhiều nút[Multi-node]

Một nút: Một nút duy nhất lưu trữ tối đa 160 GB.

Đa nút: Đa nút là một nút bao gồm nhiều hơn một nút. Nó có hai loại:

  • Leader Node
    Nó quản lý các kết nối máy khách và nhận các truy vấn. Một nút lãnh đạo nhận các truy vấn từ các ứng dụng khách, phân tích cú pháp các truy vấn và phát triển các kế hoạch thực thi. Nó phối hợp với việc thực hiện song song các kế hoạch này với nút tính toán và kết hợp các kết quả trung gian của tất cả các nút, sau đó trả về kết quả cuối cùng cho ứng dụng khách.
  • Nút
    Một nút tính toán thực hiện các kế hoạch thực thi, và sau đó các kết quả trung gian được gửi đến nút lãnh đạo để tổng hợp trước khi gửi trở lại ứng dụng khách. Nó có thể có tới 128 nút tính toán.

Hãy hiểu khái niệm về nút lãnh đạo và tính toán các nút thông qua một ví dụ.

Redshift kho là một tập hợp các tài nguyên tính toán được gọi là các nút, và các nút này được tổ chức trong một nhóm được gọi là một cụm. Mỗi cụm chạy trong Redshift Engine chứa một hoặc nhiều cơ sở dữ liệu.

Khi bạn khởi chạy phiên bản Redshift, nó bắt đầu với một nút duy nhất có kích thước 160 GB. Khi bạn muốn phát triển, bạn có thể thêm các nút bổ sung để tận dụng lợi thế của quá trình xử lý song song. Bạn có một nút lãnh đạo quản lý nhiều nút. Nút lãnh đạo xử lý kết nối máy khách cũng như các nút tính toán. Nó lưu trữ dữ liệu trong các nút tính toán và thực hiện truy vấn.

Tại sao Redshift nhanh hơn 10 lần

Redshift nhanh hơn 10 lần vì những lý do sau:

  • Lưu trữ dữ liệu theo cột
    Thay vì lưu trữ dữ liệu dưới dạng một chuỗi các hàng, Amazon Redshift tổ chức dữ liệu theo cột. Hệ thống dựa trên hàng là lý tưởng để xử lý giao dịch trong khi hệ thống dựa trên cột là lý tưởng để lưu trữ và phân tích dữ liệu, nơi các truy vấn thường liên quan đến tổng hợp được thực hiện trên các tập dữ liệu lớn. Vì chỉ các cột liên quan đến truy vấn được xử lý và dữ liệu cột được lưu trữ tuần tự trong phương tiện lưu trữ, các hệ thống dựa trên yêu cầu cột ít I / Os hơn, do đó, cải thiện hiệu suất truy vấn.
  • Nén nâng cao
    kho dữ liệu dạng cột nén nâng cao có thể được nén nhiều hơn so với kho dữ liệu dựa trên hàng vì dữ liệu tương tự được lưu trữ tuần tự trên đĩa. Amazon Redshift sử dụng nhiều kỹ thuật nén và thường có thể đạt được độ nén đáng kể so với các kho dữ liệu quan hệ truyền thống.
    Amazon Redshift không yêu cầu chỉ mục hoặc chế độ xem cụ thể hóa, vì vậy, nó yêu cầu ít dung lượng hơn so với các hệ thống cơ sở dữ liệu quan hệ truyền thống. Khi tải dữ liệu vào một bảng trống, Amazon Redshift tự động lấy mẫu dữ liệu của bạn và chọn kỹ thuật nén thích hợp nhất.
  • Xử lý song song hàng loạt
    Amazon Redshift tự động phân phối dữ liệu và tải truy vấn qua các nút khác nhau. Amazon Redshift giúp dễ dàng thêm các nút mới vào kho dữ liệu của bạn và điều này cho phép chúng tôi đạt được hiệu suất truy vấn nhanh hơn khi kho dữ liệu của bạn phát triển.

3. Tính năng Redshift

Các tính năng của Redshift được đưa ra dưới đây:

  • Dễ dàng thiết lập, triển khai và quản lý[Easy to setup, deploy and manage]

    • Redshift cung cấp tự động rất đơn giản để thiết lập và vận hành. Bạn có thể triển khai kho dữ liệu mới chỉ với một vài cú nhấp chuột trong Bảng điều khiển AWS và Redshift tự động cung cấp cơ sở hạ tầng cho bạn. Trong AWS, tất cả các tác vụ quản trị đều được tự động hóa, chẳng hạn như sao lưu và nhân rộng, bạn cần tập trung vào dữ liệu của mình chứ không phải quản trị.
    • Sao lưu
      tự động Redshift tự động sao lưu dữ liệu của bạn lên S3. Bạn cũng có thể sao chép các ảnh chụp nhanh trong S3 ở một khu vực khác để phục hồi sau thảm họa.
  • Tiết kiệm chi phí[Cost-effective]
    • Không có chi phí trả trước, thanh toán khi bạn sử dụng
      Amazon Redshift là dịch vụ kho dữ liệu tiết kiệm chi phí nhất vì bạn chỉ cần trả tiền cho những gì bạn sử dụng.Chi phí của nó bắt đầu với $ 0,25 mỗi giờ mà không có cam kết và không có chi phí trả trước và có thể mở rộng đến $ 250 mỗi terabyte mỗi năm.

      Amazon Redshift là dịch vụ kho dữ liệu duy nhất cung cấp tính năng định giá Theo yêu cầu mà không có chi phí trả trước và nó cũng cung cấp tính năng định giá phiên bản Đặt trước giúp tiết kiệm tới 75% bằng cách cung cấp thời hạn 1-3 năm.

    • Chọn loại nút của bạn.
      Bạn có thể chọn một trong hai nút để tối ưu Dịch chuyển đỏ.
      • Nút máy tính dày đặc Nút máy tính
        dày đặc có thể tạo kho dữ liệu hiệu suất cao bằng cách sử dụng CPU nhanh, dung lượng RAM lớn và đĩa trạng thái rắn.
      • Nút lưu trữ dày đặc
        Nếu bạn muốn giảm chi phí, bạn có thể sử dụng nút lưu trữ dày đặc. Nó tạo ra một kho dữ liệu hiệu quả về chi phí bằng cách sử dụng ổ đĩa cứng lớn hơn.
  • Quy mô nhanh chóng để đáp ứng nhu cầu của bạn.[Scale quickly to meet your needs]
    • Kho dữ liệu quy mô Petabyte
      Amazon Redshift tự động mở rộng quy mô lên hoặc xuống các nút tùy theo nhu cầu thay đổi. Chỉ với một vài cú nhấp chuột trong Bảng điều khiển AWS hoặc một lệnh gọi API có thể dễ dàng thay đổi số lượng nút trong kho dữ liệu.
    • Phân tích hồ dữ liệu quy mô Exabyte
      Đây là một tính năng của Redshift cho phép bạn chạy các truy vấn dựa trên exabyte dữ liệu trong Amazon S3. Amazon S3 là dữ liệu an toàn và tiết kiệm chi phí để lưu trữ dữ liệu không giới hạn ở định dạng mở.
    • Đồng thời không giới hạn
      Đó là một tính năng của Redshift có nghĩa là nhiều truy vấn có thể truy cập cùng một dữ liệu trong Amazon S3. Nó cho phép bạn chạy các truy vấn trên nhiều nút bất kể mức độ phức tạp của truy vấn hay số lượng dữ liệu.
  • Truy vấn một vùng lớn dữ liệu của bạn[Query your data lake]
    Amazon Redshift là kho dữ liệu duy nhất được sử dụng để truy vấn hồ dữ liệu Amazon S3 mà không cần tải dữ liệu. Điều này mang lại sự linh hoạt bằng cách lưu trữ dữ liệu được truy cập thường xuyên trong Redshift và dữ liệu được truy cập không có cấu trúc hoặc không thường xuyên trong Amazon S3.
  • Bảo mật[Secure]
    Với một vài cài đặt tham số, bạn có thể đặt Redshift sử dụng SSL để bảo mật dữ liệu của mình. Bạn cũng có thể kích hoạt mã hóa, tất cả dữ liệu ghi vào đĩa sẽ được mã hóa.
  • Hiệu suất nhanh hơn[Faster performance]
    Amazon Redshift cung cấp tính năng lưu trữ, nén dữ liệu dạng cột và xử lý song song để giảm số lượng I / O cần thiết để thực hiện các truy vấn. Điều này cải thiện hiệu suất truy vấn.

Cài ứng dụng cafedev để dễ dàng cập nhật tin và học lập trình mọi lúc mọi nơi tại đây.

Tài liệu từ cafedev:

Nếu bạn thấy hay và hữu ích, bạn có thể tham gia các kênh sau của cafedev để nhận được nhiều hơn nữa:

  • Group Facebook
  • Fanpage
  • Youtube
  • Instagram
  • Twitter
  • Linkedin
  • Pinterest
  • Trang chủ

Chào thân ái và quyết thắng!

-

Video liên quan

Chủ Đề