撰文者/MetaAge 邁達特 技術六處三部 架構師 Champ、技術經理 Roy、技術六處 經理 Alvin
本文將介紹 MetaAge邁達特 AWS MSP 團隊,如何幫助傳成科技在 AWS 上為客戶建立深度學習解決方案。
MetaAge 邁達特,代理 AWS 雲端服務,提供技術服務與 7 x 24 MSP 全天候託管服務,已取得 AWS MSP 夥伴資格。MetaAge 邁達特 AWS 技術團隊有技術深厚的雲端架構師,可提供全年無休的 MSP 維運,在傳統伺服器、網路及資料庫等領域,也有經驗豐富的技術工程師,並設有 AWS 軟體開發顧問。無論是部署 AWS 服務、進一步代管維運、 API 整合或雲地整合等加值服務,MetaAge 邁達特 AWS 團隊都具備完整的專業能力,相關代理品牌及客製化開發部門也可偕同服務,提供客戶一站式、多構面的完整服務。
MetaAge 邁達特 AWS 技術團隊協助傳成科技,完成在 AWS 上為客戶建立深度學習的解決方案,並由 MetaAge 邁達特託管其雲端環境,在多項層面優化客戶的使用體驗,包括以下項目:
1. 運算解決方案 2. 系統優化 3. 維運敏捷性 4. 資訊安全 5. 保障可用性 6. 成本節省
我們也協助傳成科技導入 次世代監控 及 工單系統,提供客戶完全託管、完整監控的 MSP 整合服務。
傳成科技是一家全方位的系統整合服務商,為台灣企業提供多元化的 IT 解決方案,客戶產業主要涵蓋高科技、半導體、醫療、傳統製造、電信、金融產業,並與許多主要的全球領先資料中心解決方案廠商建立合作夥伴關係,技術包含各項專業資訊領域,提供卓越的專業技術與最佳服務質量。
近年隨著 Covid-19 疫情和虛擬貨幣浪潮,世界各地都出現晶片荒,不少企業為採購相應的機器傷透了腦筋,而深度學習所需的運算設備,是最大的受災戶之一。傳成科技(以下簡稱傳成)在替客戶建立一個完整的深度學習系統平台方面,有非常豐富的相關經驗,並且有優秀的技術團隊可以維持其運作。然而,因晶片荒衍生的交貨延遲及成本上升等狀況,使傳成在替客戶建置與選購深度學習所需的地端設備上,遭遇不少困擾。而 MetaAge 邁達特 (更名前:聚碩科技) 與傳成有著多年的合作夥伴關係,傳成在與 MetaAge 邁達特 AWS 顧問團隊討論多次後,決定採用「雲端方案」為客戶提供解決方案,並希望 AWS 附加的服務價值可以提升公司的業務敏捷性和維運效率 。
( 應用 AWS 服務:Amazon EC2 G4 Instance Type )
( 圖片取自 AWS 官網 : https://aws.amazon.com/tw/machine-learning/infrastructure/ © Amazon Web Service )
透過 AWS EC2 解決方案,即可立即擁有高 CP 值的深度學習運算服務,邁達特協助傳成選擇的 G4 Instance Type ,是雲端業界最經濟實惠的 GPU Instance,最高可額外提供高達 1.8 TB 的 NVMe 型 SSD 儲存。
以傳成決定佈署的 g4dn.xlarge 這一個 Instance Type 來說,此 Instance 的 GPU 為新一代的 NVIDIA T4 GPU,並具有 16 GB 的 GPU Memory 及 1 x 125 NVMe SSD。傳成可以藉由此規格推展原本在地端為客戶搭建的運算服務,而不需要為此更動太多的設定就能夠達到原有的服務水準,並立即可以提供客戶相對應的服務內容。
2. 系統優化
傳成的用戶有遠端桌面連線 Linux 系統的需求,於是邁達特除了與傳成合作建立了深度學習所需的作業系統 Ubuntu 20.04 AMI ,並針對 RDP 連線客製化,為了使遠端桌面的操作更加順暢,我們採用了 Xfce 的桌面並搭配 LightDM 輕量的快速顯示管理平台,用以提升操作速度。
3. 維運敏捷性
( 應用 AWS 服務: Elastic File System, EC2 User data, System Manager )
客戶有 NFS File Storage 的需求,且因相關系統需要高性能的運算,因此要求硬碟的 IOPS 需達到 10,000 、容量則需要 20TB,傳統上是由傳成科技選定相對應規格的硬體與系統達成目的,而此次專案經過傳成與邁達特雙方團隊一同評估後使用了 Amazon Elastic File System,以達成相關需求條件,並且達到原有傳統上提供的服務水準,且提升了運用的敏捷性。而客戶需使用到的 Instance 達 10 個以上,因此邁達特 MSP 團隊與傳成技術團隊在維運時幫助客戶建立預先寫好的 User Data 腳本,使傳成工程師在幫客戶部署 Instance 時,可快速佈建完成。
另外在 Instance 的管理上,我們透過了 System Manager Fleet Manager 納管建立好的 Instance,使傳成的工程師能夠快速控制到所有建立的機器,並進行維運。
4. 資訊安全
( 應用 AWS 服務:Cloud Formation )
對於 Ubuntu RDP 連線的部分,傳成採用了邁達特數位代理的遠端安全連線產品,並透過 CloudFormation 自動部署在 EC2 上,替客戶進行服務,連線方式為通過 Outbound Https 加密連線與 Client 端進行溝通,用戶在不連公有 IP 的狀況下也能直接透過網際網路連線到 Instance 資源,並保障了連線的安全。
5. 保障可用性 & 6. 節費
( 應用 AWS 服務: AWS Capacity Reservations, Instance Saving Plans, 邁達特次世代監控、帳務及工單系統 )
由於客戶需求所挑選的 G Instance Type 最高會達到 120vCPUs ,在有 Instance 需要重開機的情況中,如果遇上運算尖峰時期很容易發生容量不足而建立失敗的窘境,因此邁達特幫助傳成使用了 AWS Capacity Reservations 建立了容量預留的機制,最高程度的確保了 Instance 隨時都可以取得,以維持服務的可用性。
另外由於客戶少部分的 Instance 會需要 24 小時保持開機並持續使用 1 年,針對這些機器我們透過邁達特的次世代帳務系統進行評估,推薦傳成科技使用 Instance Savings Plans 來承諾運算用量 ,大幅降低運算成本。
最後邁達特 MSP 為傳成科技導入了次世代監控及工單系統,針對客戶需求和監控事件的發生,皆有相關的 SLA 由 MSP 人員即時介入處理,確保了深度學習服務的可用性及延續性,並與傳成堅實的技術團隊相輔相成,提供更便利與嶄新的深度學習服務。
總結而論,邁達特 MSP 團隊與傳成科技為客戶提供了:
1. 可用性
通過邁達特 MSP 並導入了監控及工單系統,在發生影響可用性事件之前,可及早發現,減少 MTTD、MTTR 並提升可用性。
2. 一致性
在建立 Instance 時有腳本化且經過驗證的操作,降低手動輸入、人為錯誤的可能性。
3. 費用節省
購買 Instance Saving Plan,使傳成在需 24 小時持續運行的 Instance 上,能夠省下高達 22% 的成本。
MetaAge 邁達特代理 AWS 雲端服務,提供 7 x 24 全託管服務。邁達特在伺服器、網路、資料庫管理有豐富經驗,具備技術深厚的架構師團隊與維運團隊,是企業雲服務的最佳顧問及服務團隊。客戶無論想要部署 AWS 服務,進一步代管維運(Cloud Managed Service)、基礎架構即代碼 (Infrastructure-as-code)、 API 整合、雲地整合等加值服務,邁達特具備完整專業能力,皆能一站式滿足多構面需求。
邁達特數位 AWS MSP 團隊導入次世代監控系統,提供客戶完全託管和完整監控的 MSP 整合服務。
MetaAge 邁達特於 2022 年四月正式取得 AWS MSP (Managed Service Provider) 託管服務供應商身份。針對 AWS ,MetaAge 邁達特提供了雲顧問、雲託管等服務,若有任何 AWS 上使用的問題及需求,歡迎跟我們聯絡!
聯絡方式 —— 電話: 080-000-8669 |Email: aws@metaage.com.tw| Line@:@metaage_msp
延伸閱讀
● MetaAge 邁達特 AWS MSP 次世代監控系統介紹
● MetaAge 邁達特 AWS MSP 成功案例 —— MSP 監控系統帶給和瑞整合的具體成效
● Amazon EC2 G4 Instance 機器學習推論與圖形密集型應用程式所適用,業界最經濟實惠的 GPU Instance