乍一看,數(shù)據(jù)科學(xué)的部署似乎很簡單:只需在生產(chǎn)服務(wù)器上運(yùn)行它即可!更仔細(xì)的檢查表明,數(shù)據(jù)科學(xué)創(chuàng)建過程中構(gòu)建的內(nèi)容并不是正在投入生產(chǎn)的內(nèi)容。
想象一下一位廚師在他們的實(shí)驗(yàn)廚房中設(shè)計食譜。與數(shù)據(jù)科學(xué)家在實(shí)驗(yàn)室中使用不同數(shù)據(jù)源進(jìn)行實(shí)驗(yàn)并測試和優(yōu)化參數(shù)類似,通往完美食譜的道路涉及廚師嘗試新食材并優(yōu)化數(shù)量和烹飪時間。
投入生產(chǎn)的是最終結(jié)果:科學(xué)家的最佳模型或廚師的食譜。
這通常是差距最大的地方。為什么?
例如,問問自己是否可以使用同一組工具來進(jìn)行數(shù)據(jù)科學(xué)創(chuàng)建和部署設(shè)置;也許這兩個設(shè)置中的一個僅覆蓋另一個設(shè)置的子集。
大多數(shù)工具僅允許導(dǎo)出可能模型的子集,甚至完全忽略某些預(yù)處理步驟。您可以自動部署到服務(wù)(例如REST)或計劃作業(yè)中,還是部署只是需要嵌入到其他地方的庫/模型?
很多時候,導(dǎo)出的內(nèi)容還不能使用,而是需要手動調(diào)整。對于廚師來說,這并不是一個大問題,因?yàn)椴俗V書很少更新,而且廚師可以花一天的時間將實(shí)驗(yàn)結(jié)果轉(zhuǎn)化為適合家庭典型廚房的菜譜。
對于數(shù)據(jù)科學(xué)團(tuán)隊(duì)來說,這是一個更大的問題。團(tuán)隊(duì)需要能夠更頻繁地更新模型、部署新工具和使用新數(shù)據(jù)源,這很容易每天甚至每小時進(jìn)行一次。
添加手動步驟會降低此過程的速度,并使錯誤悄然出現(xiàn)。大型組織無法承受這種情況的發(fā)生,中小型企業(yè)更是如此。
什么樣的策略可以縮小差距?
“集成部署”方法有助于將部署過程納入數(shù)據(jù)科學(xué)周期。數(shù)據(jù)科學(xué)家可以通過捕獲部署所需的流程部分,在同一環(huán)境中對創(chuàng)建和生產(chǎn)進(jìn)行建模。
如果模型發(fā)生變化,可以進(jìn)行必要的更改,并且可以在不到一分鐘的時間內(nèi)部署修改后的數(shù)據(jù)科學(xué)流程——從用于創(chuàng)建數(shù)據(jù)科學(xué)流程的完全相同的環(huán)境進(jìn)行即時部署。
上一篇我們送上的文章是
復(fù)合鍵、主鍵和外鍵有什么區(qū)別? , _!在下一篇繼續(xù)做詳細(xì)介紹,如需了解更多,請持續(xù)關(guān)注。
本文由
日本NEC鋰電池中國營銷中心于2023-07-16 17:31:10 整理發(fā)布。
轉(zhuǎn)載請注明出處.