企業內做數據分析POC的三大原則

為什麼數據分析專案需要POC?

在企業內的數據分析專案,往往始於一個點子,但是要將一個點子落地成專案,往往需要許多人投入許多資源,尤其是越大型或是越複雜的點子,所需要投入的資源更是巨大。企業內在投入一個專案或資源前,都會對專案的可行性做評估,確保這個新的點子可以為公司帶來效益,避免實際投入成本後卻沒有帶來幫助,為此,針對新點子真正要開始進入完整的開發以前,往往都會做POC(Proof of concept)。

尤其在數據分析的專案上,POC扮演著十分重要的角色,數據分析專案的開發上有別於一般的軟體開發專案,更具有高度的不確定性,很多點子在實際放資料下去跑之前,其實很難評估出這個案子的可行性和成效為何。但倘若不做前期的小型評估,投入資源下去後發現成效不如預期,那便會是十分可惜的事情!所以在數據分析專案的規劃與開發上,更是需要做POC。

在企業內的POC階段想要達成的目標往往有以下三點:

1. 老闆們或利害關係人想知道新想法是否可行?

點子的可行性評估在整個POC的環節是十分重要的一環,這裡的可行性需要評估出這個想法是否有落地的可能性,可能的問題會包含:

‧針對要評估的數據分析專案,我們的資料量夠嗎?

‧是否有合適的技術可以實現這個點子?

‧是否有足夠的運算設備來做評估?

‧是否有足夠的專業know-how來對問題找出insight?....等等

針對『後續實作』的可行性,需要在此階段做簡要的評估。

2. 這個新點子的表現可以多好?

這裡的好,泛指可以在這個點子需要解決的問題上做得多好,可以用數據分析的指標來評估,也可以用商業的指標來評估,需要回答的問題可能會是:

‧如果是開發一份分析報表,報表中的數字真的對追蹤或評估問題有幫助嗎?

‧這個數字是不是真的是其他使用者需要的?

‧如果是開發模型的話,模型的準確度可能是多少?

‧誤差可能有多少...等等?

如果可以實作出來,那這個新點子實作出來的『成效』可以到達什麼程度。

3. 新點子需要的成本和可能的效益是?

這個第三點,其實有點承接上面兩點的問題。

如果這個點子要完整的實踐出來,可能會需要投入的成本會是多少?在未來可能為企業帶來的效益是多少?

這裡的成本可能包含投入的時間、人力、設備...以及其他為完成專案所需的資源;在效益層面,可能需要評估的是潛在的獲利、節省的成本、節省的人力...等等商業指標。

在POC的階段,需要透過POC的成果,針對成本與效益做一個簡要的評估,而這份評估,也是作為是否要持續進行開發的重要資訊。

企業內部進行POC的三大難處

1. 時間是最大的限制,POC中沒辦法達到盡善盡美

在進行一個POC專案的時候,往往所有相關人員最期待的就是在最短的時間內,盡可能完整的評估一個點子是否可行。

在一個POC的案子上,需要花多少時間來做這個評估,確是其中最難掌握的事情。投入的時間長了,很有可能錯失一些市場機會,又或者是原本的問題可能會隨著時間的過去而變得更嚴重;投入的時間短了,又可能會評估的不夠完整,導致後續真的實作時成本或風險超出預期。

該投入多少時間、該在哪個時間點做停損,這部分的投入成本掌握上是在做POC之前需要做充分拿捏的一件事情。

2. 初期資源有限,要在有限的資源中盡可能做最完整的評估

在POC階段,最主要的目標就是測試一個點子是否可行,而由於不是正式開發的案子,往往在這個階段可能沒辦法取得很多的資源。

在這個階段可能沒有太多預算,又甚至暫時沒有預算可以投入;亦或者是可取得的資料量還有限,尚沒有很大量的資料可以做分析與測試;能夠協助你執行POC的人員可能不多,大家原本手上都有各自的專案需要執行,很多事情仰賴少數人員去完成。

擔任POC專案的負責人,需要在手邊可取得的有限資源中,盡可能地對未來的風險與機會做出對企業最有利的評估。

3. 題目很多,選題不易,評估哪個點子該測試是門藝術

企業內部往往會有很多人提出不一樣的點子,但是能進行評估的專業人員往往有限。

時間有限,人員有限,資源有限,但點子卻很多。

在這個過程中,如何選擇哪個點子要或者不要?在這個時間點上要先進行哪個點子的試行?哪個點子試行的可行性是最高的?我手邊的資源足夠進行哪個點子的試行?有很多不一樣的事情需要做評估。

除了選擇哪個點子『要』試行,選擇哪個『不要』更是一門藝術,在這些要與不要的中間作權衡,往往仰賴資深人員對技術與商業的高度理解,才能增加POC的成功率。

執行POC的三大原則

在POC階段最大的挑戰就是時間與資源,然而在有限的時間與資源底下,要進行一個成功的POC,根據我自己的經驗,有三個簡要的原則是可以在前期先把握住的:

1. 把問題簡化,不用一次考慮到最完整的狀況

真實世界的情況往往很複雜,穩定可靠的產出與成果往往需要多元化的考慮許多不同的狀況,但是在POC階段時,最大的挑戰就是時間跟資源,所以我們需要針對複雜的問題簡化,才能在有限的條件下達成POC的目標。

但是雖然說是簡化,卻又不能太過簡單,過度簡單的評估往往會在實際進行開發時造成很大的風險,在實際開發時成本會容易超出預期,所以針對簡化這件事情,我通常會進行的方式是:

‧縮小問題的範疇,如果一個問題裡面有10個小狀況需要評估,那在這個階段裡面,我是不是能先針對最重要的2~3個狀況進行評估?

‧分析大量的資料需要耗費許多的運算資源,運算量越大也需要越多時間,我是不是能先減少評估的資料量?但又不致於太少,資料的分佈上要包含到多數的狀況。

根據上面兩個做法,在一個簡化問題又不失完整性的狀況下,對一個POC專案盡可能地進行完整的評估。

2. 盡量用最簡單的方法進行測試,過度複雜的方法會消耗你很多時間

數據分析的方法有很多,有很多種的統計指標、很多種的數據處理方式、很多種的演算法,有很簡單的方法可以進行評估,但也有很複雜的方法可以進行實作,複雜且完整的方法有助於你達成更好的成果,但簡單的方法可以讓你在短時間內對這個點子『有感覺』。

在POC方法的挑選上,以一個模型開發的狀況為例,我通常傾向於使用最簡單的模型來試跑,以及用最簡單的方式來針對數據做初步的處理,這樣子的做法會有幾樣好處:

‧簡單的模型通常運算時間較小,可以在前期針對這個情境建立一個基準線。

‧簡單的數據處理方式,可以減少程式的開發時間和數量,有助於在盡可能短的時間下,先取的初步的結果。

透過這兩個方式,可以在POC階段中,減少在開發與運算的時間,在盡可能短的時間下,將這個點子可能帶來的『成效下限』先實作出來,有助於評估這個點子在最差的情況下,可能最少可以達成的成效有多少。

3. 溝通、溝通、再溝通,管理對POC結果的期待,接受成功與失敗的結果

在POC階段中,大家往往會將精神集中在技術的實作上,但除了技術的評估之外,對於結果的溝通更是十分重要的事情!

因為POC具備高度的不確定性,點子實作起來可能會有很好的成果,但更有可能在多數的情況下,成果並不一定會達到所有人最初的預期,所以作為一個POC的負責人員,除了在POC時間截止時繳交評估的成果,更是需要在過程中去溝通POC過程中遇到的困難和挑戰。

除此之外,對於結果的期待,也盡量避免做過度樂觀的評估,更需要充分地去說明做出這個評估結果的原因和背後的想法,以及充分說明從中得到的收穫、商業洞見與後面的機會可能在哪裡。

盡可能做出更好的成果,但也避免過度樂觀的評估與期待。

最後

進行一個成功POC十分不容易,除了技術的成分外,有時候又更有一點運氣的成分在裡面,畢竟在一個數據分析的評估裡面,很多事情是實作下去才會知道的,過程中有著高度的不確定性。

當企業針對一個數據分析專案,進行一個POC評估時,除了需要了解POC能為我們帶來的好處之外,也需要理解POC的困難點在哪裡,在了解其中的挑戰與效益之後,更需要採取合適的方式來做前期專案的評估,才能在POC的階段上,產生最大的效益。

希望可以透過這篇文章,跟大家分享POC的一些經驗與心得,幫助大家在往後專案的POC上面,可以在最短的時間內,透過有限的資源,取得更好的成果。

Previous
Previous

探討數據分析需求訪談中的需求分析-為什麼我們會需要做實地考察?

Next
Next

企業內最常見的兩大數據分析專案類型是什麼?