本文首發微信公衆號:飛總聊IT
昨天Snowflake剛開完會,CEO和黃仁勳互相一起聊天,黃仁勳說,我會保證給你要的GPU的。
今天早上美國股市一開盤,Snowflake一直猛漲。
結果,沒過多久,就開始從高點一路往下跌。
原來Databricks的Data+AI的keynote開始了。
爲什麼Databricks一開會,Snowflake就開跌呢?
Databricks開場先出王炸,搞了一個LakehouseIQ的東西,也就是Databricks基於自己的數據庫創建的大語言模型。
我們還記得吧,前兩天Databricks。
這家被收購的公司,就是幫助企業用自己的數據從頭訓練自己的大語言模型的創業公司。
估計Databricks是最近才收購,但是早就開始訓練自己的大語言模型了。
Databricks展示了自己的LakehouseIQ的各種整合,其中有個例子,用英語問歐洲的銷售情況。
但是公司並沒有歐洲這個分類,只有東歐西歐兩個分類。LakehouseIQ很快就給出了正確的SQL。
當然LakehouseIQ能幹的東西很多。起碼demo看起來很牛逼。
這就比Snowflake那邊和黃仁勳討論顯卡要幾塊,能不能發貨高級多了。
後面Databricks又起飛地展示了怎麼樣用LakehouseIQ去debug。以及怎麼樣用MosaicML的平臺訓練自己的大模型,花費多少。還有改進後的MLFlow怎麼樣去評估不同的大語言模型之間到底哪個更牛逼等功能。
當然,Databricks還引入了自己的Vector search的東西,也就是說Databricks用自己的Lakehouse搞了個VectorDB,姑且這樣判斷吧。
所以,Snowflake的股價那是伴隨着Databricks的keynote一路往下跌,實在是自己太不行了,Databricks明顯是有備而來。
當然Databricks除了有很多大語言模型的東西以外,還加了不少自己的東西。
其中Delta Lake這個扶不起的阿斗迎來了3.0。這個3.0可以理解成爲大亂燉。什麼意思呢?就是Delta Lake在生成自己的metadata的同時也生成Iceberg和Hudi的。
這樣一來,一張表既可以當成是Delta Lake的表,也可以當做是Iceberg的表,我是你,但你還是你。這聽起來好像確實很牛逼。
不過我個人對這個做法存疑。因爲Iceberg現在有一些功能,比如說merge on read,是Delta Lake沒有的,所以雖然我可以是你,但是其實我只能是那個你的一部分,很多你的功能我並不能真的提供。
我說Delta Lake既然已經錯過了最好的時期了,不如加入Iceberg的社區算了。你好我好大家好,何必玩我是你,但你只是你的遊戲呢?
Databricks還介紹了自己的Unity Catalog的新進展,以及開始展示自己的Data Marketplace和Native APP Store。後者確實是動作慢了一點。
Snowflake有Native APP Store已經很久了,Databricks今天終於推出來了。
不管怎麼樣吧,晚來了也比沒來要強。只不過所有的native APP到底哪家強,這個問題還真的不好說。
我還忽略了一些非常技術的部分。比如說首席架構師和cofounder帶着大家重新溫習數據庫論文,給大家解釋Databricks可以怎麼樣通過機器學習突破極限,做出最牛逼的數據倉庫來等等。
不管怎麼樣吧。評價一下,Databricks在大語言模型上的手腳,真的是很快,這一點不得不刮目相看了。
應該說,除了微軟以外,這是我見到的手腳最快的一家公司了,谷歌都似乎還差了一點。至於做數據庫的公司裡,那更是獨樹一幟。
大語言模型整的快,那現在400多億的估值也就有了繼續吹牛逼的空間了,弄不好Databricks還能夠再漲一波。
這方面不得不說,Snowflake確實是慢了不止一拍。
所以,Databricks牛逼了一把,Snowflake感覺不太好看了。
最後,再宣傳一下飛總的ChatGPT朋友圈。飛總的朋友圈聚焦在大模型的技術和商業上,歡迎志同道合的人一起加入學習研究。