Logo Zephyrnet

IPO Snowflake - cái nhìn đầu tiên

Ngày:

Thời gian đọc: 7 phút

Giới thiệu

Snowflake là nhà cung cấp dịch vụ kho dữ liệu ở Hoa Kỳ. Sứ mệnh đã nêu của nó là “cho phép mọi tổ chức được điều khiển bằng dữ liệu”.

Có trụ sở tại California, công ty được thành lập bởi Benoit Dageville, Thierry Cruanes (cả hai đều là kiến ​​trúc sư tại Oracle) và Marcin Zukowsi vào năm 2012. Ngày nay, công ty được lãnh đạo bởi Frank Slootman, người đã được tuyển dụng vào công ty trong năm nay và trước đây từng là Chủ tịch. (và trước đây là Giám đốc điều hành) của ServiceNow, công ty doanh nghiệp CNTT.

Mô tả

Đúng như tên gọi của nó (bông tuyết được cho là sinh ra trên đám mây), công ty cung cấp dịch vụ SaaS 'thuần túy' không có phần cứng hoặc phần mềm để khách hàng cài đặt hoặc định cấu hình. Nó cũng không hối lỗi không cung cấp giải pháp tại chỗ (không giống như nhiều giải pháp 'nâng và chuyển') và nó có thể hoạt động trong đám mây công cộng. Nó cũng phần lớn không rõ ràng về mặt nhà cung cấp đám mây – nó có thể chạy trên AWS, Azure và Google Cloud.

Ở một khía cạnh nào đó, nó giống một “giải pháp như một dịch vụ” hơn vì việc bảo trì, quản lý và điều chỉnh liên tục đều do Snowflake xử lý. Khi khách hàng sử dụng Snowflake, công ty sẽ trở thành nhóm CNTT Kho dữ liệu cho khách hàng một cách hiệu quả và chịu trách nhiệm giải quyết các vấn đề (như lỗi hệ thống khi tải dữ liệu) và thậm chí cả các câu hỏi chung về cách hình thành truy vấn. Điều này sẽ có những hậu quả quan trọng đối với số lượng nhân viên và tài chính, sau này sẽ nói thêm về điều đó.

Đó là điểm khác biệt chính, là kiến trúc. Nó là sự kết hợp giữa kiến ​​trúc dựa trên đĩa truyền thống và kiến ​​trúc không chia sẻ, về cơ bản là các cách tiếp cận khác nhau để phân cụm:

nguồn: http://www.benstopford.com/2009/11/24/understanding-the-shared-nothing-architecture/

Trong kiến ​​trúc không chia sẻ, dữ liệu được phân vùng và trải rộng trên các nút. Mỗi nút được tạo thành từ bộ xử lý, bộ nhớ chính và đĩa. Và mỗi nút có toàn quyền tự chủ đối với tập hợp dữ liệu con của nó. Các nút không can thiệp lẫn nhau vì chúng không chia sẻ bộ nhớ hoặc bộ lưu trữ. Kết quả là một kiến ​​trúc có khả năng mở rộng cao – vì bạn có thể tiếp tục thêm các nút mà không can thiệp vào các nút hiện có (hữu ích cho các doanh nghiệp cần mở rộng quy mô nhanh chóng).

Trong kiến ​​trúc đĩa chia sẻ, tất cả dữ liệu đều có sẵn để tất cả các các nút cụm (dữ liệu không được phân vùng). Mặc dù các nút có thể có bộ nhớ riêng nhưng chúng có thể truy cập tất cả các thiết bị đĩa trong mạng. Kết quả là một kiến ​​trúc có tính sẵn sàng cao. Hạn chế là nó không có quy mô tốt vì các nút không độc lập. Ngoài ra, hai hoặc nhiều nút phải bị hạn chế cập nhật dữ liệu cùng một lúc, điều này có thể hạn chế hiệu suất.

Snowflake đã thực hiện một cách tiếp cận kết hợp. Nó đã đạt được điều này bằng cách tách lưu trữ và tính toán trong kiến ​​trúc của nó:

Nó sử dụng kho lưu trữ dữ liệu tập trung tương tự như kiến ​​trúc đĩa chia sẻ vì tất cả các nút trong kho dữ liệu đều có thể truy cập được.

Tuy nhiên, nó cũng sử dụng các cụm tính toán MPP (xử lý song song lớn) (nó gọi là Kho ảo) để xử lý các truy vấn. Mỗi nút trong cụm lưu trữ cục bộ một phần dữ liệu. Mỗi Kho ảo là một cụm tính toán độc lập, không ảnh hưởng đến hiệu suất của các Kho ảo khác.

Kết quả là sự sẵn có của thiết lập đĩa chia sẻ, với hiệu suất và khả năng mở rộng của kiến ​​trúc không chia sẻ. Đây là tính năng quan trọng nhất của nó và là trọng tâm của những gì nó làm.

Các tính năng quan trọng khác bao gồm:

    1. Độ co giãn. Theo mô hình kho dữ liệu truyền thống, các công ty phải dự báo và lập kế hoạch công suất cao nhất dự kiến ​​so với nhu cầu dữ liệu cao điểm. Dung lượng quá ít và họ phải thêm các nút mới có thể liên quan đến việc tắt môi trường cho đến khi dữ liệu được phân vùng lại trên các nút mới. Dung lượng quá lớn và có thể không có cách nào để thu nhỏ lại (đây là một chi phí không cần thiết). 

      Vì Snowflake đã tách biệt bộ lưu trữ và điện toán nên công ty có thể cung cấp cho khách hàng sự linh hoạt. Thông qua mô hình định giá trả cho mỗi lần sử dụng, khách hàng chỉ trả tiền cho dung lượng lưu trữ và điện toán được sử dụng thực tế. Một khách hàng thông thường không thực hiện truy vấn 24/7, do đó, có những khoảng thời gian họ phải trả tiền cho thời gian tính toán mà thực tế họ không sử dụng. Ngoài ra, vì chi phí lưu trữ và chi phí CPU khác nhau đáng kể nên điều này giải quyết có thể mang lại giá trị thực cho khách hàng.

    2. Khả năng xử lý dữ liệu bán cấu trúc. Nói chung, các công ty làm việc với dữ liệu bán cấu trúc (như JSON và XML) phải sử dụng các công nghệ Dữ liệu lớn phức tạp như Hadoop, MapReduce, Hive, v.v. Hoặc họ phải dành nỗ lực phát triển đáng kể trong việc triển khai các quy tắc chuyển đổi để đưa dữ liệu phi cấu trúc vào một cơ sở dữ liệu quan hệ. 

      Tuy nhiên, kiểu dữ liệu 'Biến thể' của Snowflake cho phép người dùng tải dữ liệu bán cấu trúc trực tiếp vào cơ sở dữ liệu mối quan hệ mà không cần bất kỳ thao tác dữ liệu nào. Kết quả cũng có thể được truy vấn động bằng cách sử dụng các thẻ nội bộ tự mô tả của tập dữ liệu bán cấu trúc. Điều này rất quan trọng vì lượng dữ liệu bán cấu trúc ngày càng tăng và khả năng truy vấn dữ liệu đó một cách trực tiếp và nhanh chóng để có được thông tin chi tiết có thể trở thành nguồn lợi thế cạnh tranh (ví dụ: các quy trình kiểm tra-học-cải thiện trong các ngành công nghiệp trò chơi nơi dữ liệu thường ở định dạng JSON ). 

    3. Tải và truy vấn đồng thời. Trong kho dữ liệu truyền thống, một thách thức lớn là đưa dữ liệu mới vào mà không cản trở các truy vấn và công việc hiện có. Quy trình Trích xuất-Chuyển đổi-Tải (ETL) chung có thể ảnh hưởng nghiêm trọng đến hiệu suất của kho trong quá trình thực hiện. Điều này khiến cho kho hàng đôi khi không thể sử dụng được đối với những người dùng khác. Đó là lý do tại sao các quy trình này thường được lên lịch vào ban đêm để tránh làm gián đoạn người dùng doanh nghiệp. 

      Nhưng điều này giới hạn tải dữ liệu ở tần suất hàng ngày. Và với tốc độ dữ liệu ngày càng tăng, điều này thường là không đủ. Xin nhắc lại, vì công ty đã tách riêng bộ lưu trữ và điện toán nên mỗi Máy ảo có thể chạy nhiều khối lượng công việc một cách độc lập (bao gồm cả ETL) mà không ảnh hưởng đến những người dùng khác. 

    4. Nhân bản nhanh. Tính năng này cho phép người dùng sao chép dữ liệu (bao gồm toàn bộ cơ sở dữ liệu) mà không cần tạo thêm bản sao hoặc sao chép chính dữ liệu đó. Điều này cực kỳ mạnh mẽ vì nó cho phép người dùng sao chép dữ liệu bằng không có chi phí hoặc hình phạt thời gian. (Thông thường việc sao chép một tập dữ liệu lớn có thể mất nhiều thời gian và việc lưu trữ nó không hề rẻ). 

      Lợi ích chính là tốc độ chuyển dữ liệu giữa môi trường sản xuất và thử nghiệm. Điều này cải thiện đáng kể tốc độ đưa những thay đổi của sản phẩm ra thị trường. 

    5. Tối ưu hóa truy vấn tự động. Snowflake thu thập siêu dữ liệu về các truy vấn đã thực hiện từ tất cả khách hàng và tự động điều chỉnh các truy vấn này để đảm bảo hiệu suất. Do đó, người dùng không cần phải lo lắng về việc phân vùng hoặc lập chỉ mục để đạt được hiệu suất, điều này dẫn đến trải nghiệm mà công ty gọi là 'không quản lý'.

Cũng cần lưu ý rằng vì Snowflake sử dụng cấu trúc cơ sở dữ liệu quan hệ nên SQL được sử dụng để truy vấn dữ liệu cơ bản. Bộ kỹ năng này phong phú hơn nhiều, chẳng hạn như MapReduce dành cho các công nghệ Dữ liệu lớn như Hadoop. Điều này thực sự giúp cải thiện sự chấp nhận của khách hàng và giúp việc bán hàng dễ dàng hơn cho các doanh nghiệp không có đội quân nhà khoa học dữ liệu am hiểu công nghệ.

MÔ HÌNH KINH DOANH

Như đã đề cập ở trên, công ty thực hiện chính sách trả tiền cho mỗi lần sử dụng, trong đó công ty ghi nhận doanh thu dựa trên mức tiêu thụ tài nguyên lưu trữ, điện toán và truyền dữ liệu trên nền tảng. Đây là điểm khác biệt quan trọng so với các công ty SaaS khác ghi nhận tỷ lệ doanh thu theo thời hạn hợp đồng. Nói cách khác, doanh thu của nó cao hơn biến và ít được biết/dự đoán hơn các công ty SaaS khác. Nhưng chỉ như vậy một chút thôi, vì công suất chưa sử dụng sẽ được chuyển sang các giai đoạn trong tương lai, như công ty giải thích:

“Khách hàng có thể linh hoạt sử dụng nhiều hơn công suất theo hợp đồng trong thời hạn hợp đồng và có thể chuyển công suất chưa sử dụng sang các giai đoạn trong tương lai, thường là bằng cách mua thêm công suất khi gia hạn.”

S-1 của bông tuyết

Vì vậy, nó giống hơn thời điểm ghi nhận số tiền doanh thu điều đó ít được biết/dự đoán hơn so với các mô hình SaaS đăng ký hơn là số tiền thực tế.

Để lưu trữ, công ty tính toán mức tiêu thụ dựa trên lượng terabyte trung bình mỗi tháng của tất cả dữ liệu khách hàng được lưu trữ trên nền tảng. Đối với điện toán, mức tiêu thụ dựa trên loại tài nguyên điện toán được sử dụng (mã lực lớn hơn, chi phí cao hơn) và đối với một số tính năng, khối lượng dữ liệu được xử lý. Đối với việc truyền dữ liệu, việc này dựa trên lượng terabyte dữ liệu được truyền, nhà cung cấp đám mây và khu vực.

Tất cả ba số liệu tiêu thụ (lưu trữ, điện toán và truyền dữ liệu) đều được coi là nghĩa vụ hiệu suất duy nhất vì chúng được sử dụng dưới dạng dịch vụ tích hợp.

Tài chính

Nhìn vào sản phẩm và mô hình kinh doanh của nó diễn ra như thế nào trong báo cáo tài chính, chúng tôi có những điều sau:

    • Doanh thu trong quý 2 năm 2020 là 133 triệu USD trong quý, so với 60 triệu USD cùng kỳ năm trước. Điều đó đồng nghĩa với mức tăng trưởng doanh thu là 121% (một điều đáng chú ý). So sánh 6 tháng kết thúc vào năm 2020 (xem ở trên) với cùng kỳ năm trước, dẫn đến tốc độ tăng trưởng doanh thu thậm chí còn cao hơn ~ 132%. 
    • Tỷ suất lợi nhuận gộp cũng đã được cải thiện từ ~49% năm ngoái lên ~61.5% trong giai đoạn gần đây nhất. Hãy nhớ rằng, chi phí doanh thu sẽ bao gồm chi phí duy trì hỗ trợ 'giải pháp dưới dạng dịch vụ' vì về cơ bản công ty đang thay thế Nhóm lưu trữ dữ liệu cho từng khách hàng của mình. Phương pháp này có những lợi ích về quy mô thông qua tự động hóa nhưng cũng có giới hạn về số lượng khách hàng mà một nhân viên bảo trì có thể phục vụ một cách thực tế. Khi công ty phát triển, số lượng nhân viên sẽ phải tăng lên và tỷ suất lợi nhuận gộp có thể sẽ phản ánh sự kết hợp nào đó giữa tỷ suất lợi nhuận của một công ty SaaS thuần túy và tỷ suất lợi nhuận của một công ty dịch vụ được quản lý.  
    • Công ty cũng báo cáo tỷ lệ duy trì doanh thu thuần là 158%. Con số này thậm chí còn cao hơn Tỷ lệ được báo cáo của nCino là 147%. Điều này ngụ ý rằng ngay cả khi công ty tạm dừng tất cả hoạt động bán hàng và tiếp thị, nó vẫn sẽ tăng trưởng ~ 58% chỉ bằng cách bán dịch vụ mới cho khách hàng hiện tại. Một động lực rất mạnh có thể khó bắt kịp. Xin lưu ý thêm, tỷ lệ duy trì doanh thu là 223% trong sáu tháng đầu năm 2019 - ngụ ý rằng khách hàng trung bình là hơn gấp đôi chi tiêu của họ. Đây là một cuộc bỏ phiếu rất mạnh mẽ về niềm tin/tín hiệu đối với việc cung cấp sản phẩm của công ty. 
    • Tổng số khách hàng tính đến quý 2 năm 2020 là 3,117 khách hàng, tăng so với 1547 khách hàng cùng kỳ năm trước. Ngoài ra, công ty hiện ước tính tổng thị trường có thể định địa chỉ (TAM) của mình là 81 tỷ USD.

Kết luận

Đây rõ ràng là một sản phẩm rất hấp dẫn (có lẽ là sản phẩm tốt nhất mà tôi từng đề cập), có thể sẽ khiến nhiều người phải chảy nước mắt. Trong một bài đăng sau, tôi sẽ xem xét kỹ hơn chi tiết về giá của đợt IPO (đặc biệt là thời gian khóa) và xem xét định giá.

Hãy theo dõi. 

Nguồn: https://ipohawk.com/snowflake-ipo-a-first-look/?utm_source=rss&utm_medium=rss&utm_campaign=snowflake-ipo-a-first-look

tại chỗ_img

Tin tức mới nhất

tại chỗ_img