Categories
最新消息

一年新增250+服務,AWS機器學習進化方法論


「Amazon機器學習的願景是打造一個幫用戶完成任務的工具,這個工具我們希望交付到所有人的手裡,而不簡簡單單是大科技公司擁有的工具箱。」AWS大中華區雲服務產品管理總經理顧凡表示。

機器學習可能是21世紀迄今為止最受追捧的新技術,作為這個領域的佼佼者,亞馬遜雲服務(AWS)深切體會到,在追逐新技術的熱潮中,擁有高效可用的工具是多麼重要,因此,你也能看到這種方法論指導下,AWS機器學習服務能力的進化脈絡。

一年新增250+服務,AWS機器學習進化方法論

2016年AWS開始在機器學習領域發力,當年發布了三個服務,且都是AI類服務,特點是即插即用。2017年AWS開始明顯提速,幾乎每年新發布200多個服務和功能,僅去年一年AWS發布了超過250個新產品和服務。

如上圖所示,AWS的創新當然不止體現在AI服務上,從最上層的AI服務,中間層的機器學習Amazon SageMaker,到底層機器學習框架和基礎設施,AWS層層遞進進化。

首先看底層機器學習框架和基礎設施,這也是機器學習的堅實基礎。AWS觀察到,客戶一般並不會只使用一個框架,而是經常使用三個框架,比如Tensorflow、PyTorch等,AWS的思路就是要把選擇給到客戶,內部針對不同框架分別設立調優團隊,保證各種框架下性能最優。

除了框架之外,算力同樣重要,不一樣的機器學習負載對於算力的需要不同,目前AWS是唯一一家能夠同時支持Intel、AMD和ARM處理器的廠商,同時AWS和英偉達有密切的合作關係。值得一提的是,AWS有非常強的晶元設計能力,其自主研發基於ARM的晶元AWS Inferentia,主打推理場景下最優性價比,能帶來45%性價比提升。

其次是創造機器學習的成功捷徑。AWS通過Amazon SageMaker來實現,後者是一項完全託管的機器學習服務。藉助SageMaker,數據科學家和開發人員可以快速、輕鬆地構建和訓練機器學習模型,然後直接將模型部署到生產就緒託管環境中。

與此同時,SageMaker也在不停迭代,AWS聚焦在機器學習流程的每一步,無論是數據的準備、處理,到訓練模型、快速實驗、調整參數、放到生產環境運行並且持續的監控和管理。一方面,AWS細化工具能力,讓客戶更易於使用;另一方面,AWS關注如何將這些工具串聯起來,放在一個環境、一個UI、一個工作流下,真正提升效率。

再次是擴展機器學習開發者的範圍,機器學習的開發工程師群體正在擴展,蔓延到資料庫、數據分析,甚至是一些業務人員,但這又帶來一個新的矛盾,不具備專業知識的新晉開發者如何把好的想法落地?

AWS通過一系列產品來實現,比如Amazon Aurora ML、Amazon Athena ML、Amazon Neptune,讓機器學習和現有的資料庫、分析工具之間進行集成和互動。

「我們希望機器學習有更多人參與進來,這些人並不需要懂機器學習,他只需要有主意,以及明白怎麼去用機器學習為業務帶來價值,無論是資料庫的人、數據分析的人,甚至是業務線的人,都可以用我們提供的工具在機器學習領域獲得更強的易用性。」顧凡談到。

最後是端到端地解決客戶實際業務的問題。企業客戶對於機器學習的投資不盡相同,有些企業會把整個機器學習的技術堆棧做得很全,但有些客戶會較為專註在某一層,對此,AWS總結出一些行業共通問題,並提供端到端的方案解決真實的業務問題。

「合適的工作要用合適的工具,同時一定找尋定製化的工具,機器學習服務也在深入行業場景做更多的定製化。」這是機器學習領域的行業趨勢,也是AWS一以貫之的方法論。