AutoML(自動機器學習)是深度學習的新方式,利用大數(shù)據(jù)分析、高性能計算、數(shù)據(jù)管理、算法、邊緣計算等技術。有了AutoML,我們就不再需要設計復雜的深度學習網(wǎng)絡,用于數(shù)據(jù)采集、數(shù)據(jù)預處理、優(yōu)化、應用、人工智能和機器識別等領域。AutoML是將機器學習應用于現(xiàn)實問題的端到端流程自動化的過程。

中國的人工智能市場
與美國相比,中國人工智能軟件市場的規(guī)模接近美國60%以上。與中國軟件市場占全球規(guī)模的比重相比,人工智能領域的創(chuàng)新成果顯著。預計2020-2025年,中國人工智能市場復合增長率將達到35.2%,仍占據(jù)全球主導地位。

從整體解決方案來看,2020年人工智能技術支出已經占到行業(yè)企業(yè)IT支出的5.2%,預計到2024年,與AI相關的技術支出將占IT總支出的9.1%。從客戶服務到運營流程,從生產制造到IT支撐部門,越來越多的組織中的業(yè)務流程和數(shù)字化應用正在集成或嵌入機器學習和AI技術,以支持業(yè)務智能決策。


企業(yè)級AutoML需具備的能力
如今,大多數(shù)用戶對AutoML的概念和現(xiàn)狀沒有清晰的認識。結合當前產品和行業(yè)用戶智能化現(xiàn)狀的基礎上,小藍認為現(xiàn)階段企業(yè)級AutoML產品必須具備六大能力,遵循機器學習發(fā)展流程的基礎之上:適配行業(yè)屬性、開放靈活、低代碼易上手、可視化效果好、效率與成本平衡、支持快速部署。


AutoML最佳實踐
某省銀行
截至2020年末,該行總資產7574.83億元人民幣,下轄18家分行、2家直屬支行,共494個營業(yè)網(wǎng)點。2018年以來,該銀行啟動數(shù)字化轉型,成立數(shù)據(jù)銀行部。目前AI團隊規(guī)模在70人左右。堅持自主研發(fā)創(chuàng)新的發(fā)展路線,金融科技能力處于國內城市銀行領先水平。
2018年以來,該銀行采用開源社區(qū)的Zeppelin系統(tǒng),實現(xiàn)了小規(guī)模、非協(xié)作的機器學習模型的開發(fā)。隨著數(shù)據(jù)智能應用建設的加速,為實現(xiàn)企業(yè)級AI協(xié)同和云原生AI服務,2019年某省銀行搭建企業(yè)級機器學習平臺。該平臺作為企業(yè)級模型開發(fā)和運營平臺,為數(shù)據(jù)科學家和建模者提供處理后的數(shù)據(jù),為上層業(yè)務應用提供接口工具。
主要在三個方向部署應用:
1)在營銷方向:平臺開發(fā)營銷類模型、生產營銷資源和話術,為客戶經理提供產品銷售預測和潛在客戶名單篩選,實現(xiàn)數(shù)字化營銷。
2)在運營方向上:采用OCR識別技術,讓開戶轉賬更加便捷,采用NLP技術,支持電話智能客服,優(yōu)化升級智能知識庫,利用預測模型,在網(wǎng)點智能派發(fā)現(xiàn)金,實現(xiàn)運營流程自動化。
3)在風控方向:平臺上部署了信用記分卡等模型,基于DL算法進行聯(lián)合建模,后者已實現(xiàn)拒絕回撈客戶數(shù)萬戶,累計放款數(shù)千萬人民幣。目前,該銀行自主研發(fā)了數(shù)十個機器學習項目,發(fā)布了OCR、NLP等數(shù)十項AI服務,日均調用數(shù)千次,場景工作量替代率達到70%,賦能全行業(yè)務數(shù)字化轉型升級。
在AutoML方面,該銀行使用DataCanvas的AutoML工具DAT,目前的效果主要體現(xiàn)在自動特征衍生和數(shù)據(jù)處理環(huán)節(jié)。目前該銀行AI應用開發(fā)中最費時費力的部分是數(shù)據(jù)準備和特征選擇環(huán)節(jié)。當具備場景和數(shù)據(jù)可用時,DAT可以幫助業(yè)務分析師直接上手應用程序開發(fā)。同時,DAT還可以幫助建模工程師處理特征和優(yōu)化超參數(shù)。目前能節(jié)省20-30%的工作量,預計未來提效會更加明顯。

某航空公司
該航空公司在多年的運營過程中積累了大量的數(shù)據(jù)。在智能化轉型升級過程中,與高校、外部伙伴合作開發(fā)AI算法模型,探索智能化應用。
應用主要關注三種場景:
1)運行類:在燃油消耗管理的應用中,機載飛行數(shù)據(jù)記錄儀QAR記錄飛行參數(shù)數(shù)據(jù),基于機器學習算法的航班燃油消耗影響因素模型可以通過分析這些數(shù)據(jù)為燃油精細化管理提供決策支持,實現(xiàn)單條航線在一個月內節(jié)省數(shù)十噸航油的成果。
2)飛機維修類:在發(fā)動機損傷識別場景中,需要采用工業(yè)視頻內窺鏡伸入發(fā)動機上預留的觀察孔進行觀察、拍攝圖像,并通過基于深度學習的圖像分析算法識別劃痕的生長等情況,可以提高故障診斷的效率。2021年5月,該航空公司《數(shù)據(jù)驅動飛機健康監(jiān)控與預測維修關鍵技術》獲得2019年民航科學技術獎(民航全行業(yè)科技類的唯一獎項)一等獎,實現(xiàn)了民航維修領域的技術創(chuàng)新和能力突破。
3)營銷類:營銷部門人員正在AutoML開發(fā)AI算法,將用于票價分析、旅客人數(shù)預測等營銷場景,其中人數(shù)預測模型也可用于飛機動態(tài)備餐場景。

某股份制銀行
該行基于AutoML賦能多個行內數(shù)字化轉型場景,如營銷領域的產品推薦、風險控制領域的貸款違約率預測、反欺詐反洗錢、內部管理領域的現(xiàn)金流預測和員工行為監(jiān)控管理。
基于AutoML,該行的開發(fā)人員可以基于平臺的工作流使用已有算子快速定制、訓練模型,對定制化開源模型進行統(tǒng)一的開發(fā)和管理,從而降低數(shù)據(jù)建模的門檻,減少代碼量,提高建模效率。具體在模型訓練方面,對于數(shù)量較小的模型仍然采用單機建模訓練,對于Spark框架中樣本超過百萬的模型進行分布式訓練。隨著平臺加快模型訓練和部署,從模型構建、部署到生產應用的時間從1-2個月縮短到2-3周。從業(yè)務價值的角度來看,營銷A/B測試表明,與業(yè)務專家的經驗相比,該模型在客戶引流和風險交易管理方面帶來了顯著的改善。


AutoML加速您的AI應用上線
在AI人才還不充足的今天,采用AutoML能夠幫助組織快速形成AI能力,提高開發(fā)效率,降低需要人工操作的任務量,促進機器學習民主化等等。從機器學習開發(fā)流程的角度,AutoML可以減少人類在設計機器學習模型時出現(xiàn)的偏差和錯誤;企業(yè)也可以通過應用AutoML來降低雇傭高級專家的成本。隨著組織中需要管理的模型數(shù)量的增長以及日益增加的應用AI實現(xiàn)智能化升級的需求,有必要考慮引入AutoML工具,加速智能化應用的部署上線。
藍海大腦利用大數(shù)據(jù)分析、高性能計算、數(shù)據(jù)管理、算法、邊緣計算等技術,自主研發(fā)的液冷GPU服務器為AutoML提供硬件保證。

|