Tác giả: Vivek Sabrina, Nguồn: Silicon Rabbit Race
Nguồn hình ảnh: Được tạo bởi công cụ Unbounded AI
Snowflake và Databricks luôn là hai công ty nhận được nhiều sự chú ý trong lĩnh vực cơ sở dữ liệu, tuy ở cùng một địa điểm nhưng mỗi công ty đều có những đặc điểm riêng và sự cạnh tranh chưa được đặt lên bàn cân.
Trong làn sóng AI tổng hợp này, hai công ty đang rất tích cực thông qua việc mua lại. Snowflake đã hoàn tất việc mua lại Neeva (công cụ tìm kiếm AI cấp doanh nghiệp) và Databricks mua lại MosaicML (triển khai mô hình ML) với giá 1,3 tỷ đô la Mỹ, đồng thời công bố việc mua lại vào năm 2019. một cách đơn giản.thu được OmniML (Model Compression).
Hai công ty đã bí mật thay đổi tình trạng hòa hợp trên bề mặt và cạnh tranh trước đây, đồng thời chọn tổ chức cuộc họp thường niên quan trọng nhất của công ty vào cùng một ngày, nêu bật cách bố trí AI sáng tạo của họ và không thể che giấu tham vọng của họ.
Snowflake sẽ ra mắt công chúng vào năm 2020, với giá trị thị trường hiện tại là 57,92 tỷ đô la Mỹ (2023.8.1). Databricks vẫn chưa được niêm yết. Theo vòng gọi vốn gần đây nhất, giá trị của nó đã đạt 38 tỷ đô la Mỹ. Với sự hỗ trợ của trí tuệ nhân tạo AI, liệu định giá/giá trị thị trường niêm yết trong tương lai của Databricks có thể bắt kịp Snowflake không? Snowflake có thể đưa nó lên cấp độ tiếp theo không?
Vivek, một đối tác của Madrona, và nhà đầu tư Sabrina, người đã đầu tư vào Snowflake, đã chia sẻ quan điểm của họ về việc hai công ty đang vật lộn trong lĩnh vực trí tuệ nhân tạo.
Tuần trước là một tuần quan trọng đối với những người hành nghề trong lĩnh vực dữ liệu và trí tuệ nhân tạo, khi hai trong số những người chơi quan trọng nhất — Databricks và Snowflake — lần lượt tổ chức các hội nghị thường niên của họ ở San Francisco và Las Vegas (Hội nghị thượng đỉnh về dữ liệu và trí tuệ nhân tạo của Databricks và Hội nghị thượng đỉnh của Snowflake) .
Không phải ngẫu nhiên mà hai gã khổng lồ này lại quyết định tổ chức sự kiện lớn trong cùng một tuần. **Snowflake và Databricks vừa là bạn vừa là đối thủ trong thập kỷ qua, nhưng tuần này đã làm rõ rằng họ hiện là đối thủ truyền kiếp của nhau và chiến trường mới là trí tuệ nhân tạo. **
Không có gì ngạc nhiên khi phần lớn các cuộc thảo luận và thông báo tại cả hai hội nghị đều xoay quanh AI tổng quát. Thông điệp chính là để xây dựng chiến lược AI tổng quát, mọi công ty phải bắt đầu với chiến lược dữ liệu.
Không có gì ngạc nhiên khi cả Databricks và Snowflake đều đưa ra lý do tại sao họ có thể hỗ trợ khách hàng tốt nhất trong hành trình này.
Làm thế nào mà hai công ty bắt đầu ở các phần khác nhau của chuỗi giá trị, thậm chí từng là đối tác chiến lược, lại phát triển thành những đối thủ cạnh tranh khốc liệt như vậy trong kỷ nguyên trí tuệ nhân tạo mới này?
Hãy tìm hiểu sâu hơn.
[Tuyên bố nhanh từ chối trách nhiệm: Madrona đã đầu tư vào vòng Series C của Snowflake và vẫn sở hữu một số cổ phần trong công ty. 】
01Snowflake: Từ Kho dữ liệu đến Đám mây dữ liệu
Snowflake được thành lập vào năm 2012 bởi Benoît Dageville và Thierry Cruanes. Họ là hai chuyên gia về cơ sở dữ liệu đã làm việc tại Oracle trong nhiều năm và họ quan sát sâu sắc rằng hầu hết các kho dữ liệu đều "cứng nhắc, đắt tiền và khó sử dụng". Dageville và Cruanes hợp tác với Marcin Zukowski, cựu Giám đốc điều hành của Vectorwise, để xây dựng kho dữ liệu của tương lai dựa trên ba tiền đề chính:
Kiến trúc hoàn toàn dựa trên đám mây;
Tính toán và lưu trữ riêng biệt để đạt được khả năng mở rộng gần như không giới hạn;
Tính linh hoạt trong việc sử dụng tài nguyên máy tính, cho phép tốc độ xử lý truy vấn và tính linh hoạt chưa từng có.
Ngày nay, Snowflake đã phát triển từ kho dữ liệu đám mây "chỉ" thành "đám mây dữ liệu" cung cấp cho khách hàng một nền tảng duy nhất để truy cập, xây dựng, cộng tác và kiếm tiền từ dữ liệu của họ. Chỉ trong hơn một thập kỷ, Snowflake đã phát triển thành một công ty đại chúng trị giá 55 tỷ USD, phục vụ hơn 6.000 khách hàng và nhiều công ty trong danh sách Fortune 500. Snowflake đã hợp tác với các nhà cung cấp đám mây siêu quy mô lớn (Azure, AWS và GCP) và giờ đây họ đã đặt mục tiêu rõ ràng vào AI để thu hút nhiều sự chú ý hơn.
Để đạt được mục tiêu này, họ đã thực hiện một loạt thương vụ mua lại và ra mắt sản phẩm trong lĩnh vực trí tuệ nhân tạo và máy học, bao gồm:
Snowpark cho phép các nhà khoa học dữ liệu sử dụng ngôn ngữ lập trình ưa thích của họ để phát triển, triển khai và điều phối khối lượng công việc học máy từ đầu đến cuối. Với Snowpark, khách hàng có thể nhập, phân tích và chuyển đổi dữ liệu của họ để đào tạo các mô hình máy học và chạy nhiều phân tích dự đoán hơn.
Streamlit là một công cụ xây dựng ứng dụng dựa trên dữ liệu mà Snowflake mua lại vào tháng 3 năm 2022 với giá 800 triệu USD. Streamlit cho phép khách hàng phát triển các ứng dụng sử dụng nhiều dữ liệu chỉ với một vài dòng mã. Streamlit đơn giản hóa quá trình bối cảnh hóa các nhiệm vụ phân tích dữ liệu và đầu ra mô hình máy học thông qua các ứng dụng web mặt trước.
Neeva, một công ty mà Snowflake mua lại vào đầu năm nay, nhằm mục đích tăng tốc tương tác doanh nghiệp và tìm kiếm dữ liệu, đặc biệt là theo cách trò chuyện nhiều hơn.
02Databricks:Xây dựng Lakehouse
Databricks được thành lập vào năm 2013, chỉ một năm sau Snowflake. Không giống như Benoit và Theyry, những người hành nghề trong ngành, Databricks được thành lập bởi một nhóm người có mối quan hệ sâu sắc với giới học thuật và cộng đồng nguồn mở.
Bảy người sáng lập, bao gồm Giám đốc điều hành hiện tại Ali Ghodsi, là các nhà nghiên cứu của AMPLab tại UC Berkeley và đã hình thành nên Apache Spark, một công cụ phân tích hợp nhất mã nguồn mở để xử lý dữ liệu quy mô lớn. Spark đã phát triển thành một trong những khung xử lý dữ liệu lớn nhất và được sử dụng nhiều nhất, đóng vai trò quan trọng trong kỹ thuật dữ liệu quy mô lớn, khoa học dữ liệu và máy học.
Mục tiêu ban đầu của Databricks là thương mại hóa Spark, ra mắt phiên bản Spark cấp doanh nghiệp cung cấp tất cả các tính năng (quản trị, hỗ trợ, lưu trữ, v.v.) mà các tổ chức lớn cần. Databricks sau đó đã phát triển thành "Nền tảng Lakehouse" sáng tạo hợp nhất dữ liệu, phân tích và trí tuệ nhân tạo. Khái niệm Lakehouse hợp nhất kết hợp "tích hợp, lưu trữ, xử lý, quản trị, chia sẻ, phân tích và trí tuệ nhân tạo" trên một nền tảng duy nhất.
Trong thập kỷ qua, Databricks đã trở thành một trong những công ty tư nhân được định giá cao nhất thế giới, với mức định giá năm 2021 là 38 tỷ USD và gần đây đã đạt được cột mốc doanh thu 1 tỷ USD. Họ phục vụ hàng chục nghìn khách hàng doanh nghiệp và người dùng nguồn mở, đồng thời được coi là một trong những đợt IPO nổi tiếng nhất. Giữa tất cả sự tăng trưởng này, họ ngày càng định vị mình là người dẫn đầu về AI, với các vụ mua lại và ra mắt sản phẩm đáng chú ý gần đây, bao gồm cả việc mua lại MosaicML trị giá 1,3 tỷ đô la (thêm về điều đó bên dưới) và cung cấp nguồn mở Dolly, một LLM được điều chỉnh theo hướng dẫn mà có thể được đào tạo với giá dưới 30 đô la.
03 Va chạm trong AI
Cả Snowflake và Databricks đều có vị trí tốt để tiếp tục tận dụng các xu hướng cấu trúc dài hạn khi các doanh nghiệp chuẩn bị cho sự chuyển đổi sang AI tổng quát. Cả hai công ty đang cố gắng định vị mình là nền tảng dữ liệu đa sản phẩm chiến lược khi các ứng dụng AI tổng quát trở nên phổ biến rộng rãi hơn. Dưới đây là một số thông báo quan trọng từ các hội nghị tương ứng của họ và ý kiến của chúng tôi về chiến lược AI tổng thể của mỗi công ty.
Thông báo chính của Snowflake:
THÔNG BÁO CỦA NHÀ PHÁT TRIỂN
Khung ứng dụng gốc của Snowflake: Nó có thể được mở rộng dựa trên đám mây dữ liệu của Snowflake bằng cách cho phép các nhà phát triển tạo, phân phối và kiếm tiền từ các ứng dụng để sử dụng dữ liệu theo những cách mới.
Dịch vụ bộ chứa Snowpark: Mở rộng khả năng lập trình dữ liệu và cơ sở hạ tầng máy tính để hỗ trợ các ngôn ngữ lập trình, truy cập phần mềm của bên thứ ba, đồng thời cung cấp khả năng quản trị và bảo mật nâng cao để lưu trữ các ứng dụng full-stack và LLM. Tính linh hoạt hơn nữa được cung cấp bằng cách khái quát hóa nền tảng điện toán của Snowflake, cho phép khách hàng chạy các ứng dụng đầu cuối hoàn chỉnh từ lớp dưới cùng (lớp dữ liệu) cho đến lớp giao diện người dùng.
Các thông báo quan trọng khác: Khả năng phát trực tuyến của Snowpipe; Bảng động (còn được gọi là Bảng cụ thể hóa); Tài liệu AI (một dịch vụ mới để trích xuất dữ liệu phi cấu trúc từ tài liệu); và Bảng băng trôi.
Thông báo về đối tácSnowflake đã công bố một số đối tác quan trọng bao gồm NVIDIA, Microsoft và Trọng số & Xu hướng.
Quan hệ đối tác với NVIDIA có kế hoạch nhúng khung phát triển doanh nghiệp NeMo của họ vào đám mây dữ liệu của Snowflake, điều này sẽ cho phép khách hàng của Snowflake xây dựng và triển khai LLM và các ứng dụng dựa trên AI sử dụng dữ liệu độc quyền được lưu trữ trong Snowflake.
Sự hợp tác với Microsoft sẽ mở rộng quan hệ đối tác với Azure, tập trung vào tích hợp sản phẩm mới xung quanh các dịch vụ OpenAI và Azure AI/ML của Microsoft Azure. Sự hợp tác này có khả năng đưa khối lượng công việc và khách hàng vào đám mây dữ liệu.
Hợp tác với Weights & Biases, một nền tảng MLOps hàng đầu, dịch vụ vùng chứa của Snowflake cho phép Weights & Biases đẩy nhanh quá trình phát triển lặp lại của các mô hình ML, LLM và các ứng dụng dựa trên LLM trong đám mây dữ liệu Snowflake. Cuối cùng, sự hợp tác này sẽ giúp các doanh nghiệp và người dùng dễ dàng xây dựng và tận dụng trí tuệ nhân tạo hơn.
Ngoài hai công ty này, Snowflake đã công bố nhiều quan hệ đối tác khác với Alteryx, Hex, Dataiku, RelationalAI, Pinecone và những công ty khác.
QUAN ĐIỂM CỦA CHÚNG TÔI
Cho đến gần đây, Snowflake không tiết lộ bất kỳ kế hoạch nào để bổ sung AI tổng quát vào các khả năng hiện có của mình và nhiều nhà đầu tư bày tỏ lo ngại về khả năng cạnh tranh của Snowflake trong không gian này, đặc biệt là so với Databricks. Tuy nhiên, tại hội nghị thượng đỉnh năm 2023, Snowflake đã trình bày một tầm nhìn mạnh mẽ, định vị mình là nhà cung cấp đám mây dữ liệu đáng tin cậy và cùng với đó là xây dựng một câu chuyện mạnh mẽ về AI tổng quát.
Sự hợp tác của Snowflake với Nvidia và việc công bố dịch vụ thùng chứa Snowpark khiến họ trở thành một người chơi khả thi hơn trong ngăn xếp dữ liệu AI. Điểm cốt lõi mà họ muốn truyền đạt là họ có thể cho phép khách hàng truy cập, phát triển và triển khai LLM và các ứng dụng dựa trên AI một cách an toàn trong đám mây dữ liệu Snowflake, đồng thời cung cấp điện toán tăng tốc với GPU Nvidia và phần mềm AI.
Mặc dù câu chuyện và thông điệp của họ rất ấn tượng, nhưng chúng tôi cho rằng họ vẫn bị lép vế so với Databricks trong lĩnh vực AI...
Thông báo chính của Databricks:
THÔNG BÁO CỦA NHÀ PHÁT TRIỂN
LakehouseIQ: Giao diện ngôn ngữ tự nhiên dựa trên LLM để tìm kiếm và truy vấn dữ liệu, đồng thời hiểu rõ dữ liệu của khách hàng, biệt ngữ nội bộ và các mẫu sử dụng để hiểu kiến trúc, tài liệu, truy vấn, hệ thống, v.v. của khách hàng.
**LakehouseAI: **Databricks đã công bố một số tính năng mới trong Databricks ML, bao gồm một số tính năng về LLMOps như tích hợp dữ liệu, chuẩn bị bộ dữ liệu cho học máy, tinh chỉnh và quản lý các mô hình học máy cũng như tự triển khai các mô hình . Databricks cũng đã công bố một số tính năng xung quanh Tìm kiếm Vector, Dịch vụ Tính năng và Cổng MLFlow.
MosaicML: Ngay trước hội nghị, Databricks đã công bố việc mua lại MosaicML với giá 1,3 tỷ đô la, được định vị là "cỗ máy xây dựng mô hình GenAI" trong hội nghị.
**Các thông báo đáng chú ý khác: **Delta Lake 3.0, MLFlow 2.5 hỗ trợ giám sát thông minh các LLM phụ trợ khác nhau, Ứng dụng Lakehouse và Giám sát Databricks Lakehouse.
quan điểm của chúng tôi
Databricks áp dụng cách tiếp cận thống nhất đối với AI bằng cách tập hợp dữ liệu, mô hình AI, khả năng giám sát và quản trị vào nền tảng Lakehouse. Do đó, Databricks cho phép khách hàng phát triển các giải pháp GenAI của họ hiệu quả hơn và khách hàng coi Databricks là một đối tác đáng tin cậy, trung bình là nhanh hơn, tiết kiệm chi phí hơn và dễ sử dụng hơn trong quá trình phát triển máy học.
Mặc dù đã được coi là người đóng vai trò quan trọng trong ngăn xếp AI, Databricks đã củng cố vị trí dẫn đầu của mình trong GenAI thông qua các khoản đầu tư vào các mô hình như Dolly, một LLM tuân theo hướng dẫn mã nguồn mở và một thương vụ mua lại lớn của MosaicML. Databricks tiếp tục nhấn mạnh Lakehouse của họ là cách tốt nhất để các công ty khởi nghiệp GenAI đào tạo và triển khai các mô hình AI của riêng họ, tận dụng dữ liệu độc quyền của riêng họ theo cách tiết kiệm chi phí mà không bị ràng buộc bởi các công ty công nghệ lớn.
**04 Nhìn về phía trước, chúng ta có thể mong đợi điều gì? **
Mặc dù cơn sốt AI tổng hợp đã diễn ra được hơn tám tháng, nhưng tuần vừa qua đã cho thấy rõ ràng rằng Snowflake và Databricks đang chạy đua giành trí tuệ và thị phần trong lĩnh vực này. Vì vậy, những gì chúng ta có thể mong đợi từ sự cạnh tranh cao độ này?
Việc mua lại sẽ tiếp tục → Cả Snowflake và Databricks đều có vị thế tương đối tốt để tiếp tục mua lại các công ty nhỏ hơn nhằm bổ sung cho chiến lược tổng thể của họ. Snowflake có khoảng 4 tỷ đô la tiền mặt trên bảng cân đối kế toán, trong khi Databricks có sẵn mức định giá cao để giao dịch. Trong khi đó, hàng trăm công ty khởi nghiệp về công cụ dữ liệu và AI đang háo hức tìm lối thoát trong thị trường IPO khô khan. Chúng tôi không nghĩ rằng Neeva và MosaicML sẽ là thương vụ mua lại cuối cùng của những gã khổng lồ này và sẽ có sự hợp nhất trên thị trường.
Khách hàng sẽ được hưởng lợi → Trong cuộc cạnh tranh ngày càng leo thang giữa Snowflake và Databricks, người chiến thắng rõ ràng phải là khách hàng của họ. Hai gã khổng lồ đang nhanh chóng bổ sung các sản phẩm và dịch vụ mới vào nền tảng của họ, xây dựng "cửa hàng một cửa" để khách hàng xây dựng các ứng dụng dữ liệu và tận dụng LLM. Cải tiến nền tảng này sẽ giúp dân chủ hóa quyền truy cập vào AI và cho phép các nhà khoa học dữ liệu, kỹ sư dữ liệu và những người thực hành AI cộng tác có ý nghĩa hơn.
Azure và AWS sẽ kiếm được nhiều lợi nhuận hơn → Khi Snowflake và Databricks tiếp tục mở rộng hơn nữa trong thị trường AI, chúng sẽ yêu cầu rất nhiều sức mạnh tính toán, chủ yếu do Azure và AWS cung cấp. Kỹ sư dữ liệu Anant Packidurali tinh ý quan sát điều này. Cũng giống như cách Nvidia thu được lợi ích từ AI, các nhà cung cấp dịch vụ đám mây siêu quy mô cung cấp cơ sở hạ tầng cho nhu cầu điện toán của Snowflake và Databricks sẽ có lợi bất kể bên nào chiến thắng trong cuộc đua AI.
Khi các doanh nghiệp ngày càng dựa vào dữ liệu để hỗ trợ các chiến lược AI tổng quát của họ, chúng tôi tin rằng cả Snowflake và Databricks đều có vị trí thuận lợi để tận dụng sự thay đổi mang tính thế hệ này. Mặc dù họ đến từ các phần khác nhau của chuỗi giá trị và mối quan hệ của họ đã phát triển trong thập kỷ qua, nhưng giờ đây họ đang ở trong một cuộc đua với những phần thưởng khổng lồ.
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Hàng chục tỷ đô la trong cuộc chiến nền tảng, cuộc chiến AI tạo ra dữ liệu đám mây
Tác giả: Vivek Sabrina, Nguồn: Silicon Rabbit Race
Snowflake và Databricks luôn là hai công ty nhận được nhiều sự chú ý trong lĩnh vực cơ sở dữ liệu, tuy ở cùng một địa điểm nhưng mỗi công ty đều có những đặc điểm riêng và sự cạnh tranh chưa được đặt lên bàn cân.
Trong làn sóng AI tổng hợp này, hai công ty đang rất tích cực thông qua việc mua lại. Snowflake đã hoàn tất việc mua lại Neeva (công cụ tìm kiếm AI cấp doanh nghiệp) và Databricks mua lại MosaicML (triển khai mô hình ML) với giá 1,3 tỷ đô la Mỹ, đồng thời công bố việc mua lại vào năm 2019. một cách đơn giản.thu được OmniML (Model Compression).
Hai công ty đã bí mật thay đổi tình trạng hòa hợp trên bề mặt và cạnh tranh trước đây, đồng thời chọn tổ chức cuộc họp thường niên quan trọng nhất của công ty vào cùng một ngày, nêu bật cách bố trí AI sáng tạo của họ và không thể che giấu tham vọng của họ.
Snowflake sẽ ra mắt công chúng vào năm 2020, với giá trị thị trường hiện tại là 57,92 tỷ đô la Mỹ (2023.8.1). Databricks vẫn chưa được niêm yết. Theo vòng gọi vốn gần đây nhất, giá trị của nó đã đạt 38 tỷ đô la Mỹ. Với sự hỗ trợ của trí tuệ nhân tạo AI, liệu định giá/giá trị thị trường niêm yết trong tương lai của Databricks có thể bắt kịp Snowflake không? Snowflake có thể đưa nó lên cấp độ tiếp theo không?
Vivek, một đối tác của Madrona, và nhà đầu tư Sabrina, người đã đầu tư vào Snowflake, đã chia sẻ quan điểm của họ về việc hai công ty đang vật lộn trong lĩnh vực trí tuệ nhân tạo.
Tuần trước là một tuần quan trọng đối với những người hành nghề trong lĩnh vực dữ liệu và trí tuệ nhân tạo, khi hai trong số những người chơi quan trọng nhất — Databricks và Snowflake — lần lượt tổ chức các hội nghị thường niên của họ ở San Francisco và Las Vegas (Hội nghị thượng đỉnh về dữ liệu và trí tuệ nhân tạo của Databricks và Hội nghị thượng đỉnh của Snowflake) .
Không phải ngẫu nhiên mà hai gã khổng lồ này lại quyết định tổ chức sự kiện lớn trong cùng một tuần. **Snowflake và Databricks vừa là bạn vừa là đối thủ trong thập kỷ qua, nhưng tuần này đã làm rõ rằng họ hiện là đối thủ truyền kiếp của nhau và chiến trường mới là trí tuệ nhân tạo. ** Không có gì ngạc nhiên khi phần lớn các cuộc thảo luận và thông báo tại cả hai hội nghị đều xoay quanh AI tổng quát. Thông điệp chính là để xây dựng chiến lược AI tổng quát, mọi công ty phải bắt đầu với chiến lược dữ liệu.
Không có gì ngạc nhiên khi cả Databricks và Snowflake đều đưa ra lý do tại sao họ có thể hỗ trợ khách hàng tốt nhất trong hành trình này.
Làm thế nào mà hai công ty bắt đầu ở các phần khác nhau của chuỗi giá trị, thậm chí từng là đối tác chiến lược, lại phát triển thành những đối thủ cạnh tranh khốc liệt như vậy trong kỷ nguyên trí tuệ nhân tạo mới này?
Hãy tìm hiểu sâu hơn.
[Tuyên bố nhanh từ chối trách nhiệm: Madrona đã đầu tư vào vòng Series C của Snowflake và vẫn sở hữu một số cổ phần trong công ty. 】
01Snowflake: Từ Kho dữ liệu đến Đám mây dữ liệu
Snowflake được thành lập vào năm 2012 bởi Benoît Dageville và Thierry Cruanes. Họ là hai chuyên gia về cơ sở dữ liệu đã làm việc tại Oracle trong nhiều năm và họ quan sát sâu sắc rằng hầu hết các kho dữ liệu đều "cứng nhắc, đắt tiền và khó sử dụng". Dageville và Cruanes hợp tác với Marcin Zukowski, cựu Giám đốc điều hành của Vectorwise, để xây dựng kho dữ liệu của tương lai dựa trên ba tiền đề chính:
Kiến trúc hoàn toàn dựa trên đám mây;
Tính toán và lưu trữ riêng biệt để đạt được khả năng mở rộng gần như không giới hạn;
Tính linh hoạt trong việc sử dụng tài nguyên máy tính, cho phép tốc độ xử lý truy vấn và tính linh hoạt chưa từng có. Ngày nay, Snowflake đã phát triển từ kho dữ liệu đám mây "chỉ" thành "đám mây dữ liệu" cung cấp cho khách hàng một nền tảng duy nhất để truy cập, xây dựng, cộng tác và kiếm tiền từ dữ liệu của họ. Chỉ trong hơn một thập kỷ, Snowflake đã phát triển thành một công ty đại chúng trị giá 55 tỷ USD, phục vụ hơn 6.000 khách hàng và nhiều công ty trong danh sách Fortune 500. Snowflake đã hợp tác với các nhà cung cấp đám mây siêu quy mô lớn (Azure, AWS và GCP) và giờ đây họ đã đặt mục tiêu rõ ràng vào AI để thu hút nhiều sự chú ý hơn.
Để đạt được mục tiêu này, họ đã thực hiện một loạt thương vụ mua lại và ra mắt sản phẩm trong lĩnh vực trí tuệ nhân tạo và máy học, bao gồm:
Snowpark cho phép các nhà khoa học dữ liệu sử dụng ngôn ngữ lập trình ưa thích của họ để phát triển, triển khai và điều phối khối lượng công việc học máy từ đầu đến cuối. Với Snowpark, khách hàng có thể nhập, phân tích và chuyển đổi dữ liệu của họ để đào tạo các mô hình máy học và chạy nhiều phân tích dự đoán hơn.
Streamlit là một công cụ xây dựng ứng dụng dựa trên dữ liệu mà Snowflake mua lại vào tháng 3 năm 2022 với giá 800 triệu USD. Streamlit cho phép khách hàng phát triển các ứng dụng sử dụng nhiều dữ liệu chỉ với một vài dòng mã. Streamlit đơn giản hóa quá trình bối cảnh hóa các nhiệm vụ phân tích dữ liệu và đầu ra mô hình máy học thông qua các ứng dụng web mặt trước.
Neeva, một công ty mà Snowflake mua lại vào đầu năm nay, nhằm mục đích tăng tốc tương tác doanh nghiệp và tìm kiếm dữ liệu, đặc biệt là theo cách trò chuyện nhiều hơn.
02Databricks: Xây dựng Lakehouse
Databricks được thành lập vào năm 2013, chỉ một năm sau Snowflake. Không giống như Benoit và Theyry, những người hành nghề trong ngành, Databricks được thành lập bởi một nhóm người có mối quan hệ sâu sắc với giới học thuật và cộng đồng nguồn mở.
Bảy người sáng lập, bao gồm Giám đốc điều hành hiện tại Ali Ghodsi, là các nhà nghiên cứu của AMPLab tại UC Berkeley và đã hình thành nên Apache Spark, một công cụ phân tích hợp nhất mã nguồn mở để xử lý dữ liệu quy mô lớn. Spark đã phát triển thành một trong những khung xử lý dữ liệu lớn nhất và được sử dụng nhiều nhất, đóng vai trò quan trọng trong kỹ thuật dữ liệu quy mô lớn, khoa học dữ liệu và máy học.
Mục tiêu ban đầu của Databricks là thương mại hóa Spark, ra mắt phiên bản Spark cấp doanh nghiệp cung cấp tất cả các tính năng (quản trị, hỗ trợ, lưu trữ, v.v.) mà các tổ chức lớn cần. Databricks sau đó đã phát triển thành "Nền tảng Lakehouse" sáng tạo hợp nhất dữ liệu, phân tích và trí tuệ nhân tạo. Khái niệm Lakehouse hợp nhất kết hợp "tích hợp, lưu trữ, xử lý, quản trị, chia sẻ, phân tích và trí tuệ nhân tạo" trên một nền tảng duy nhất.
Trong thập kỷ qua, Databricks đã trở thành một trong những công ty tư nhân được định giá cao nhất thế giới, với mức định giá năm 2021 là 38 tỷ USD và gần đây đã đạt được cột mốc doanh thu 1 tỷ USD. Họ phục vụ hàng chục nghìn khách hàng doanh nghiệp và người dùng nguồn mở, đồng thời được coi là một trong những đợt IPO nổi tiếng nhất. Giữa tất cả sự tăng trưởng này, họ ngày càng định vị mình là người dẫn đầu về AI, với các vụ mua lại và ra mắt sản phẩm đáng chú ý gần đây, bao gồm cả việc mua lại MosaicML trị giá 1,3 tỷ đô la (thêm về điều đó bên dưới) và cung cấp nguồn mở Dolly, một LLM được điều chỉnh theo hướng dẫn mà có thể được đào tạo với giá dưới 30 đô la.
03 Va chạm trong AI
Cả Snowflake và Databricks đều có vị trí tốt để tiếp tục tận dụng các xu hướng cấu trúc dài hạn khi các doanh nghiệp chuẩn bị cho sự chuyển đổi sang AI tổng quát. Cả hai công ty đang cố gắng định vị mình là nền tảng dữ liệu đa sản phẩm chiến lược khi các ứng dụng AI tổng quát trở nên phổ biến rộng rãi hơn. Dưới đây là một số thông báo quan trọng từ các hội nghị tương ứng của họ và ý kiến của chúng tôi về chiến lược AI tổng thể của mỗi công ty.
Thông báo chính của Snowflake:
THÔNG BÁO CỦA NHÀ PHÁT TRIỂN
Khung ứng dụng gốc của Snowflake: Nó có thể được mở rộng dựa trên đám mây dữ liệu của Snowflake bằng cách cho phép các nhà phát triển tạo, phân phối và kiếm tiền từ các ứng dụng để sử dụng dữ liệu theo những cách mới.
Dịch vụ bộ chứa Snowpark: Mở rộng khả năng lập trình dữ liệu và cơ sở hạ tầng máy tính để hỗ trợ các ngôn ngữ lập trình, truy cập phần mềm của bên thứ ba, đồng thời cung cấp khả năng quản trị và bảo mật nâng cao để lưu trữ các ứng dụng full-stack và LLM. Tính linh hoạt hơn nữa được cung cấp bằng cách khái quát hóa nền tảng điện toán của Snowflake, cho phép khách hàng chạy các ứng dụng đầu cuối hoàn chỉnh từ lớp dưới cùng (lớp dữ liệu) cho đến lớp giao diện người dùng.
Các thông báo quan trọng khác: Khả năng phát trực tuyến của Snowpipe; Bảng động (còn được gọi là Bảng cụ thể hóa); Tài liệu AI (một dịch vụ mới để trích xuất dữ liệu phi cấu trúc từ tài liệu); và Bảng băng trôi.
Thông báo về đối tácSnowflake đã công bố một số đối tác quan trọng bao gồm NVIDIA, Microsoft và Trọng số & Xu hướng.
Quan hệ đối tác với NVIDIA có kế hoạch nhúng khung phát triển doanh nghiệp NeMo của họ vào đám mây dữ liệu của Snowflake, điều này sẽ cho phép khách hàng của Snowflake xây dựng và triển khai LLM và các ứng dụng dựa trên AI sử dụng dữ liệu độc quyền được lưu trữ trong Snowflake.
Sự hợp tác với Microsoft sẽ mở rộng quan hệ đối tác với Azure, tập trung vào tích hợp sản phẩm mới xung quanh các dịch vụ OpenAI và Azure AI/ML của Microsoft Azure. Sự hợp tác này có khả năng đưa khối lượng công việc và khách hàng vào đám mây dữ liệu.
Hợp tác với Weights & Biases, một nền tảng MLOps hàng đầu, dịch vụ vùng chứa của Snowflake cho phép Weights & Biases đẩy nhanh quá trình phát triển lặp lại của các mô hình ML, LLM và các ứng dụng dựa trên LLM trong đám mây dữ liệu Snowflake. Cuối cùng, sự hợp tác này sẽ giúp các doanh nghiệp và người dùng dễ dàng xây dựng và tận dụng trí tuệ nhân tạo hơn.
Ngoài hai công ty này, Snowflake đã công bố nhiều quan hệ đối tác khác với Alteryx, Hex, Dataiku, RelationalAI, Pinecone và những công ty khác.
QUAN ĐIỂM CỦA CHÚNG TÔI
Cho đến gần đây, Snowflake không tiết lộ bất kỳ kế hoạch nào để bổ sung AI tổng quát vào các khả năng hiện có của mình và nhiều nhà đầu tư bày tỏ lo ngại về khả năng cạnh tranh của Snowflake trong không gian này, đặc biệt là so với Databricks. Tuy nhiên, tại hội nghị thượng đỉnh năm 2023, Snowflake đã trình bày một tầm nhìn mạnh mẽ, định vị mình là nhà cung cấp đám mây dữ liệu đáng tin cậy và cùng với đó là xây dựng một câu chuyện mạnh mẽ về AI tổng quát.
Sự hợp tác của Snowflake với Nvidia và việc công bố dịch vụ thùng chứa Snowpark khiến họ trở thành một người chơi khả thi hơn trong ngăn xếp dữ liệu AI. Điểm cốt lõi mà họ muốn truyền đạt là họ có thể cho phép khách hàng truy cập, phát triển và triển khai LLM và các ứng dụng dựa trên AI một cách an toàn trong đám mây dữ liệu Snowflake, đồng thời cung cấp điện toán tăng tốc với GPU Nvidia và phần mềm AI.
Mặc dù câu chuyện và thông điệp của họ rất ấn tượng, nhưng chúng tôi cho rằng họ vẫn bị lép vế so với Databricks trong lĩnh vực AI...
THÔNG BÁO CỦA NHÀ PHÁT TRIỂN
LakehouseIQ: Giao diện ngôn ngữ tự nhiên dựa trên LLM để tìm kiếm và truy vấn dữ liệu, đồng thời hiểu rõ dữ liệu của khách hàng, biệt ngữ nội bộ và các mẫu sử dụng để hiểu kiến trúc, tài liệu, truy vấn, hệ thống, v.v. của khách hàng.
**LakehouseAI: **Databricks đã công bố một số tính năng mới trong Databricks ML, bao gồm một số tính năng về LLMOps như tích hợp dữ liệu, chuẩn bị bộ dữ liệu cho học máy, tinh chỉnh và quản lý các mô hình học máy cũng như tự triển khai các mô hình . Databricks cũng đã công bố một số tính năng xung quanh Tìm kiếm Vector, Dịch vụ Tính năng và Cổng MLFlow.
MosaicML: Ngay trước hội nghị, Databricks đã công bố việc mua lại MosaicML với giá 1,3 tỷ đô la, được định vị là "cỗ máy xây dựng mô hình GenAI" trong hội nghị.
**Các thông báo đáng chú ý khác: **Delta Lake 3.0, MLFlow 2.5 hỗ trợ giám sát thông minh các LLM phụ trợ khác nhau, Ứng dụng Lakehouse và Giám sát Databricks Lakehouse.
quan điểm của chúng tôi
Databricks áp dụng cách tiếp cận thống nhất đối với AI bằng cách tập hợp dữ liệu, mô hình AI, khả năng giám sát và quản trị vào nền tảng Lakehouse. Do đó, Databricks cho phép khách hàng phát triển các giải pháp GenAI của họ hiệu quả hơn và khách hàng coi Databricks là một đối tác đáng tin cậy, trung bình là nhanh hơn, tiết kiệm chi phí hơn và dễ sử dụng hơn trong quá trình phát triển máy học.
Mặc dù đã được coi là người đóng vai trò quan trọng trong ngăn xếp AI, Databricks đã củng cố vị trí dẫn đầu của mình trong GenAI thông qua các khoản đầu tư vào các mô hình như Dolly, một LLM tuân theo hướng dẫn mã nguồn mở và một thương vụ mua lại lớn của MosaicML. Databricks tiếp tục nhấn mạnh Lakehouse của họ là cách tốt nhất để các công ty khởi nghiệp GenAI đào tạo và triển khai các mô hình AI của riêng họ, tận dụng dữ liệu độc quyền của riêng họ theo cách tiết kiệm chi phí mà không bị ràng buộc bởi các công ty công nghệ lớn.
**04 Nhìn về phía trước, chúng ta có thể mong đợi điều gì? **
Mặc dù cơn sốt AI tổng hợp đã diễn ra được hơn tám tháng, nhưng tuần vừa qua đã cho thấy rõ ràng rằng Snowflake và Databricks đang chạy đua giành trí tuệ và thị phần trong lĩnh vực này. Vì vậy, những gì chúng ta có thể mong đợi từ sự cạnh tranh cao độ này?
Việc mua lại sẽ tiếp tục → Cả Snowflake và Databricks đều có vị thế tương đối tốt để tiếp tục mua lại các công ty nhỏ hơn nhằm bổ sung cho chiến lược tổng thể của họ. Snowflake có khoảng 4 tỷ đô la tiền mặt trên bảng cân đối kế toán, trong khi Databricks có sẵn mức định giá cao để giao dịch. Trong khi đó, hàng trăm công ty khởi nghiệp về công cụ dữ liệu và AI đang háo hức tìm lối thoát trong thị trường IPO khô khan. Chúng tôi không nghĩ rằng Neeva và MosaicML sẽ là thương vụ mua lại cuối cùng của những gã khổng lồ này và sẽ có sự hợp nhất trên thị trường.
Khách hàng sẽ được hưởng lợi → Trong cuộc cạnh tranh ngày càng leo thang giữa Snowflake và Databricks, người chiến thắng rõ ràng phải là khách hàng của họ. Hai gã khổng lồ đang nhanh chóng bổ sung các sản phẩm và dịch vụ mới vào nền tảng của họ, xây dựng "cửa hàng một cửa" để khách hàng xây dựng các ứng dụng dữ liệu và tận dụng LLM. Cải tiến nền tảng này sẽ giúp dân chủ hóa quyền truy cập vào AI và cho phép các nhà khoa học dữ liệu, kỹ sư dữ liệu và những người thực hành AI cộng tác có ý nghĩa hơn.
Azure và AWS sẽ kiếm được nhiều lợi nhuận hơn → Khi Snowflake và Databricks tiếp tục mở rộng hơn nữa trong thị trường AI, chúng sẽ yêu cầu rất nhiều sức mạnh tính toán, chủ yếu do Azure và AWS cung cấp. Kỹ sư dữ liệu Anant Packidurali tinh ý quan sát điều này. Cũng giống như cách Nvidia thu được lợi ích từ AI, các nhà cung cấp dịch vụ đám mây siêu quy mô cung cấp cơ sở hạ tầng cho nhu cầu điện toán của Snowflake và Databricks sẽ có lợi bất kể bên nào chiến thắng trong cuộc đua AI.
Khi các doanh nghiệp ngày càng dựa vào dữ liệu để hỗ trợ các chiến lược AI tổng quát của họ, chúng tôi tin rằng cả Snowflake và Databricks đều có vị trí thuận lợi để tận dụng sự thay đổi mang tính thế hệ này. Mặc dù họ đến từ các phần khác nhau của chuỗi giá trị và mối quan hệ của họ đã phát triển trong thập kỷ qua, nhưng giờ đây họ đang ở trong một cuộc đua với những phần thưởng khổng lồ.