澎湃新聞記者 邵文
2006年亞馬遜雲科技(Amazon Web Services,以下簡稱AWS)是全球第一家推出雲計算服務的公司,當時雲計算的概念才剛剛興起。15年後,雲計算幾乎無處不在,AWS的年度re:Invent大會也成為雲計算領域科技趨勢和前沿進展的重要觀察地。
對於未來,亞馬遜全球副總裁、亞馬遜雲科技大中華區執行董事張文翊近日在re:Invent大會上表示:“我們正在構建更加強大的算力,透過像5G和物聯網這樣的創新技術,把雲推到更多的邊緣。我們正在推動資料、分析和機器學習的無縫整合。我們還在為特定應用場景和行業提供定製化的解決方案。”
雖然已經發展了15年,在亞馬遜雲科技執行長Adam Selipsky看來,雲計算還處在非常早的時期。他援引分析師的估計,目前雲上支出只佔整個IT支出的5%到15%。未來將有大量的工作負載遷移到雲,大量的創新即將在雲上開展,雲產業前景巨大。
值得注意的是,納斯達克在re:Invent大會宣佈和亞馬遜雲科技達成多年合作伙伴關係,宣佈將分階段把全部業務遷移到亞馬遜雲科技,為全球資本市場構建新一代雲計算基礎設施。在2022年,納斯達克將先把美國的一個期權交易市場上雲。為了實現全面上雲的目標,適應對延時的要求,納斯達克透過Amazon Outposts建立了一個混合架構,推出了金融行業第一個專用亞馬遜雲科技本地區域。這一合作將應用到納斯達克全球130多個企業客戶,幫助這些企業建立標準化的上雲路徑。
納斯達克作為一個全球性的金融市場眾所周知,實際上它的業務版圖早就不止於此,它還是一個為資本市場提供技術和SaaS服務的供應商。
Adam Selipsky表示:“納斯達克和亞馬遜雲科技將共同為資本市場創造新的可能,幫助他們加快創新和改進業務流程。結合納斯達克長達50年來為資本市場開拓新技術的專業經驗,以及亞馬遜雲科技成熟的安全性、可靠性和彈性,將幫助我們共同的客戶以及納斯達克持續發展業務,每天無縫地完成數十億美元的交易。隨著納斯達克開啟上雲的第二個十年之旅,此次合作將助力納斯達克更輕鬆地將核心基礎設施遷移上雲,繼續創造新服務。”
機器學習與數字孿生:將使用門檻降到最低
“資料真正推動行業驚天動地轉型的一個領域就是工業製造。無論是設計還是供應鏈管理,還是高質量交付,比如大眾汽車今年會向市場投放1100萬輛汽車,每天向工廠就得投入2億零部件。透過和亞馬遜雲科技的攜手,它們將120多個分散的工廠和3萬多家供應商的資料全部整合到雲裡,形成單一整合的資料庫。這樣一個數據庫帶來的分析就可以讓它們的生產力提升30%,”亞馬遜雲科技大中華區產品部總經理顧凡介紹道。
那麼如何將機器學習門檻降到最低,使不具備機器學習經驗、資料科學經驗,也不是開發者,也能做機器學習?亞馬遜雲科技推出了Amazon SageMaker Canvas:可透過視覺化的點選介面,生成高準確度的機器學習預測,而不需要寫程式程式碼。
顧凡認為,技術的演進其中一個趨勢就是越來越多地降低門檻,不斷擴充套件使用人群的邊界。
比如業務人員,“他懂業務流程,懂業務場景,他可以看到業務的挑戰,可以猜測用機器學習去解決業務場景中的一個問題可以提升多大效率,但是他搞不定的是,不懂Python,也不懂數學模型。那麼在他想用機器學習減少客戶流失、欺詐檢測,甚至預測銷售和最佳化庫存的時候,即可用Amazon SageMaker來構建想要的機器學習模型,不用求資料科學家,”顧凡描述道。
完成機器學習的背後是數字孿生。
數字孿生是任何物理實體、物理流程和服務在虛擬環境中的虛擬投射、對映,每個實體的數字孿生都精確地模擬它的實體。比如一個航空的噴氣發動機有數字孿生,裝配此發動機的生產線也有數字孿生的對映,這條生產線所在的工廠車間也有。
過去測試新產品,一般要做出物理的實體產品,千錘百煉。今天則可以透過構建新產品的數字孿生,然後在虛擬的數字孿生世界裡執行成千上萬次的測試,為產品去建模以及改善其效能。
那麼如何構建數字孿生呢?這首先需要將跟物理實體相關的所有資料來源匯入到數字孿生的模型,弄清楚資料來源和實體之間的關係,同時需要將此資料疊加到3D視覺模型上,然後才能真正創建出一個視覺化、3D可見的虛擬孿生體。
與此同時,物理世界的資料無時無刻不在變化,如何保證更新的資料能夠及時反映到數字孿生體?這是一項技術門檻和成本都非常高昂的活動。
在re:Invent上,亞馬遜雲科技釋出一項新的IoT服務Amazon IoT TwinMaker,目標是讓開發人員更加輕鬆、快捷地建立現實世界的數字孿生,如樓宇、工廠、工業裝置和生產線。
“數字孿生有望讓工業流程型企業改朝換代。然而,打造數字孿生很不容易,這些工作需要企業投入專業開發人員,且耗費巨大精力。我們希望盡力幫助更多公司獲得構建數字孿生的能力。所以,今天我們釋出了新服務Amazon IOT TwinMaker,讓開發人員更輕鬆地建立樓宇、工廠、工業裝置和生產線等實體系統的數字孿生,”Adam Selipsky說道。
Amazon IoT TwinMaker可直接匯入多個來源(如裝置感測器、攝像機和業務應用程式)的資料,並將這些資料結合起來建立一個知識圖譜,從而對現實世界環境進行建模。
同時推出的另一項IoT服務是Amazon IoT FleetWise,其針對汽車行業解決汽車製造商資料收集、管理和上雲的難題。透過Amazon IoT FleetWise,汽車製造商可以輕鬆地收集和管理汽車中任何格式的資料(無論品牌、車型或配置),並將資料格式標準化,方便在雲上輕鬆進行資料分析,還可以根據天氣條件、位置或汽車型別等引數來制定上傳資料的時間規則。
當資料進入雲端後,汽車製造商就可以將資料應用於車輛的遠端診斷程式,分析車隊的健康狀況,幫助汽車製造商預防潛在的召回或安全問題,或透過資料分析和機器學習來改進自動駕駛和高階輔助駕駛等技術。
“車載感測器每小時可產生多達2TB的資料。而且隨著品牌和型號不斷增加,資料格式各不相同,所以必須建立定製的資料收集系統。然而,建立這些系統既困難又耗時。我們今天釋出了Amazon IOT FleetWise,讓汽車廠商輕鬆、低成本地收集、轉換資料,並且近乎實時地將資料傳輸到雲,”Adam Selipsky說道。
使用Amazon IoT FleetWise將資料上傳到雲後,汽車製造商就可以應用亞馬遜雲科技服務的廣度和深度,從汽車資料中提取資料分析結果。例如,當自動駕駛系統以低於90%的置信度識別路標中的文字時,汽車製造商就可以使用智慧過濾功能,收集在新建高速公路上行駛的汽車的攝像頭資料。
按需配置5G專網:搭建時間從數月降到幾天
“今天,高效能、高可靠的網路正發揮前所未有的重要性。我們幾乎連線萬物,包括產線機器人、工人和店員手中的平板電腦、聯網的空調、電梯和叉車、需要可靠資料連線管理物流的送貨車輛等等。所有這些新的使用場景都需要一致性、可靠的網路連線。”Adam Selipsky 表示。
但是設計、建設和部署行動網路需要大量的時間,而且是一個需要電信專業知識的複雜過程。另外,企業還需要評估、對口多家供應商,適應不同供應商的定價模式,尤其是大多數供應商按裝置數收費。當裝置數量成千上萬時,費用則大幅增加。
亞馬遜雲科技在當天推出Amazon Private 5G,目標是使按需配置部署和擴充套件5G專網變得簡單,企業搭建5G專網的時間可以從數月降到幾天。使用者可以指定希望建立移動專網的位置,以及終端裝置所需網路容量,亞馬遜雲科技負責交付、維護、建立5G專網和連線終端裝置所需的小型基站、伺服器、5G核心和無線接入網路(RAN)軟體,以及使用者身份模組(SIM卡)。Amazon Private 5G可以自動設定和部署網路,並按需根據額外裝置和網路流量的增長擴容。
弗若斯特沙利文(Frost & Sullivan)諮詢總監李慶評論道:“5G作為基礎網路設施實現萬物互聯,而萬物互聯的節奏首先要實現小範圍內的互聯互通,5Gto B再to C。對於大型工業企業,尤其以能源、大型製造業、汽車、碼頭港口來看,他們對於網路的穩定性以及低延時的需求較高,這主要是透過5G網路切片技術實現。由於大型企業自身業務的龐大性和獨特性,對私有專網的需求會進一步提升。原來的專網部署需要前期的大量測算與規劃,部署週期較長,較難跟上業務的迭代速度。面對聯網裝置的數量近幾年爆發式增長的情況,企業需要擁有快速自建5G專用網路的能力以高效匹配自身區域內的互聯互通,同時也要保證安全性。但是‘高效’和‘安全’是需要應對的兩大挑戰,更快部署Private 5G網路環境將成為供應商未來的競爭力之一,安全性又依賴於邊緣雲的監控處理能力以及管理能力。”
她認為,亞馬遜雲科技此次釋出的Amazon Private 5G服務最大的亮點在於簡化部署和按需擴容,按需付費,大大降低了企業的時間成本和金錢成本,並且提高了企業的自主性,非常適合快速發展新興業務企業,短時間內也比較適合在北美推出。
“獲得資料分析的好處,而不用管理基礎設施”
Adam Selipsky在主題演講中宣佈,“有些企業希望獲得資料分析的好處,卻不想管理基礎設施。他們不想去做叢集調優,不關心那些儀表盤和按鈕,還有的企業不希望預測應用需要多少基礎設施。我們的Amazon Athena和Amazon Glue已經消除了基礎設施和容量管理的需求。我們問自己,其它的分析服務是否也可以把基礎設施工作完全剔除。今天,我非常高興地宣佈,針對四個資料分析服務推出新的無伺服器和按需選項,包括Amazon Redshift、Amazon EMR、Amazon MSK和Amazon Kinesis流資料服務。”
Amazon Redshift Serverless可在幾秒鐘內自動設定和擴充套件資源,實現在PB級資料規模執行高效能工作負載,而無需管理資料倉庫叢集。
Amazon Managed Streaming for Apache Kafka (Amazon MSK) Serverless可快速擴充套件資源,極大地簡化實時資料攝取和流式傳輸;Amazon EMR Serverless則無需部署、管理和擴充套件底層基礎設施,即可使用開源大資料框架(如 Apache Spark、Hive 和 Presto)執行分析應用程式。
Amazon Kinesis On-demand是亞馬遜雲科技為Amazon Kinesis Data Streams(一種用於捕獲、處理和儲存流媒體資料的無伺服器服務)推出的新功能(新的容量模式),利用它可以提供每分鐘GB級別的讀寫吞吐量,而無需進行容量規劃。
Forrester首席分析師戴鯤指出:“根據Forrester的研究,從早期的函式即服務(FaaS)延展到近兩年的無伺服器容器(Serverless Container/Kubernetes)和無伺服器應用(Serverless Applications),以事件驅動、自動化和分層解耦為主要特徵的無伺服器計算(Serverless)可以有效幫助開發人員聚焦業務創新,顯著降低運維團隊的運營成本。本次推出的Amazon RedShift、Amazon EMR和Amazon MSK三項分析服務的Serverless版本,是無伺服器計算在分析領域的又一次融合創新,有望幫助企業在數倉、大資料框架、以Kafka為基礎的流資料處理等領域進一步遮蔽底層複雜性,加速創新。”
責任編輯:李躍群