search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

那些行業數據是怎麼求出來的?

本文作者將從數據工具、統計分析、計算和估計以及結果檢驗四方面來為你解析:那些行業數據是怎麼求出來的?一起來看看~

思考一下類似於這樣的問題:北京的機動車數量有多少?深圳市有多少家咖啡廳?這些問題的提出,通常與我們的工作息息相關。面對熟悉有陌生的市場,我們經常會遇到數據收集的需求。無論是對運營還是產品,怎麼樣對市場有一個清晰合理的認識,可能關係到一款產品的市場大小,和需求的強弱。

我在兩次上線項目過程中,都需要過類似的數據需求問題。而通過對數據的推測和分析,我幫助產品實施了準確的市場策略。希望與大家分享數據推測的一點心得。

一. 數據工具

其實,在宏觀上對數據進行敏銳的統計,我們只有兩種方法可以選擇:第一種,直接從數據結果維度考慮,考慮一步拿到結果。比如「人口和世界人口數」這樣的數據,完全是可以通過簡單搜索就能完成的,權威部門已經發布過了這樣的數據結果;第二種,是在不能獲取到直接的結果數據的基礎上,想辦法透析數據結果的影響變數有哪些,通過分化目標,去獲取哪些影響變數的數值,就有機會推導計算出我們需要的結果。

但是,無論是哪一種方法,都需要了解一些常規的數據工具。數據工具是用來了解已公布已公開的信息的最好途徑,通過數據工具中已有的數據,我們能解決一部分問題。比如,百度指數,好搜指數、微博指數、谷歌趨勢、友盟指數、Alexa等工具,提供了我們需要的基礎數據和趨勢對比,能夠幫助我們建立基本的認識判斷。

這裡以「成都市有多少快遞員」為例,來看如何通過分析和推測得出我們需要的結果。

我們先通過多款搜索引擎直接搜索相關問題,看不能直接一步得到數據結果。過程不在這裡贅述,通過搜索,我們應該都能比較容易的找到這樣的結論:2012年開始,快遞行業從業人員數量就不再公布。這意味著我們需要尋求第二種解決辦法,分析需要的結果變數。

二. 統計分析

在第一步里,我們通過行業官網這個基礎數據工具找到了一些基礎的參考點,這些東西幫助我們能很迅速的將這個問題分解為「全國快遞人數有多少」等類似的問題。

這是因為在不能獲得直接結果時,我們可以這樣考慮這個問題:第一,成都市的快遞員工數量不好獲知,全國的快遞員工數量應該是比較容易的;第二,快遞員工的數量是和業務量成強烈的正相關關係的,我們可以通過獲悉全國業務量的多少,再想辦法找到省市區域業務量的佔比,就能大概估計出快遞員工的人數。

有了這個分析之後,我們很快就可以通過權威的行業網站,找到官方發布的快遞員工往年人數和年增長比率。實際上,通過搜索,我們也能發現,行業信息網這樣的行業站點,也是按此思路,給出了2013年到2016年,快遞員工人數年增長水平,也即每年增加10萬-20萬人,據此,我們可以很快從往年已公布數據,推測出2016年的快遞員工數量——150萬,到160萬之間。

那麼,如果要區分開自營物流和傳統配送企業的員工怎麼辦呢,通過搜索,我們也可以得到,四通一達的統計數據,注意,這個數據並不能夠直接幫助我們獲得最終答案,但是能讓我們的統計變得更嚴謹和準確。

三. 計算和估計

在這個基礎上,我們就能知道說,四通一達和百事匯通的員工總數為82萬,在全行業佔比50%左右。那麼,現在我們知道了快遞員工的全國人數,要推導出成都的人數,就需要用到計算了。

按前面已經說過的邏輯,我們現在變為查詢四川省佔全國業務量百分比,以及成都佔全省業務量的百分比。通過百分比關係,我們把快遞人數和業務量按比例關係對應了起來。通過搜索,我們能找到相關的新聞報道,由於帶有官方的統計屬性,結果還是比較可信的。通過查詢,我們知道四川省佔全國業務量百分比為2.36%,成都佔全省業務量百分比為78%。這就是我們需要的關鍵數據。

通過簡單相乘計算,我們就能得到想要的估計數據了,用2.36%乘上全國快遞人數或不含自營快遞的全國快遞人數,就得到了四川省的快遞人員數字,再通過成都業務量與全省業務量的佔比數字78%,進一步相乘,得到成都的快遞人員數。

這裡需要注意,如果有時間的話,可以多想一步,思考一下誤差的可能來源,在這裡,誤差來源主要是時間上的,統計數據不是一個時間維度,由於發展速度影響,可能會導致最終的比率有小範圍的波動。當然,這個波動並不大,不會對整體結果有大幅度的影響。實際上,即便我們能準確獲知統計數字,也存在誤差,因為人員變動是每天都在發生的,這是系統誤差的一部分。

四. 結果檢驗

得到了想要的結果就是這麼容易。我們只是需要注意數據的來源地是否可信就行了。在這個案例中我把來源地址都進行了標註,方便後續我對細節進行詳細的了解。

得到結果后,我們如果可以的話,可以對結果進行一個簡單的檢測。檢測的意義是看我們得到的結果可信度如何。比如,我如果得出的數據是100萬,你直觀邏輯判斷就會認為這是錯的,這也是一種檢驗,所不同的是,這是常理檢驗,而不是數據檢驗罷了。

我們得到的結果看上去可信,但究竟數據可信度如何,我們可以通過側面估計法再來檢驗。在這個案例中,我們同樣根據產業信息網的下圖數據,獲知四川省每平方公里快遞網點數量在0.02左右,而四川省區域面積是很好得到的,是48.6萬平方千米,換算可得,四川省綜合快遞網點約有9720個。

根據前文得到的業務量佔比情況,我們能夠得到成都快遞網點數,計算下來大概是7581個。假設我們的結果是正確的情況下,七千多個網點和一萬五到三萬的快遞人數,推測出每個網點平均有3名左右的配送員。考慮到四川是非江浙地區,這個數字和常理認知是相符的。所以檢驗通過。

五. 總結

通過這個案例,我們分析了如何對一個不能直接獲知結果的問題,進行解剖分析。我們就能通過多項數據估測得出想要的結果。快遞人員和什麼有關呢?直觀感受是快遞網點數和快遞業務量,所以我們可以查找這兩項數據指標。然後儘可能去新聞媒體中找到相關的官方指標,側面求解想要的答案。

這個案例只是很多問題中的一個簡單應用。實際上,如果我們對行業數據比較敏感的話,甚至能從其它方面來估計結果,直接心算出答案。掌握了這個方法和思路,我們就能去推導這些稍複雜的問題:廣州有多少麵包師、有多少腳踏車工廠、甘肅每天外賣下單數有多少……

總之,將求解問題分解和轉換,對於答案的求得尤為重要。

作者:奉政坊,開發工程師轉行運營,策劃運營過多起上線項目,鈦媒體作者

本文由 @奉政坊 原創發佈於人人都是產品經理。未經許可,禁止轉載。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦