文|互聯網怪盜團特邀成員 戰車(元芳)
怪盜團團長按:
本文的作者元芳是我的一位前同事和好友。他目前擔任某券商傳媒互聯網首席分析師,在培訓新人方面投入了很多精力。這是他分享的第三堂課,如果有人對前兩堂課感興趣,請點此閱讀:證券分析師的第一堂課; 證券分析師的第二堂課;證券分析師的第三堂課。
根據我過去多年的經歷,國內投資行業對年輕人總是要求太多,恨不得入職之后立即發揮巨大作用;訓練又太少,幾乎談不上成熟的培養體系。其實,中國的職場哪里不是這樣呢?工作了幾年,只能依靠自己領悟,沒有形成工作框架的大有人在。
我相信,在投資研究中形成的方法論、分析能力,廣泛地適用于各式各樣的行業研究和戰略研究。
證券分析師的第四堂課:如何收集、處理和分析行業數據?
數據是研究報告的血肉,是支撐報告結論的重要組成部分(支撐報告結論的重要組成依次為:邏輯推導、數據支持和事實案例)。數據收集、處理和分析的好壞直接決定著研究報告的質量。盡管數據相關內容是最基礎的工作,但是你會發現不同入行年限的分析師,對于數據的收集、處理和分析差距非常大,并且隨著對行業和公司的理解,在報告中對于數據的使用會越來越精簡、恰當和有效。
此外,我們也分享一下我們對于“數據方法論”上的一些看法。
其一,獨立思考與“抄”并不矛盾。我們其實非常建議初學者要多看、多學、多“抄”,因為對于基礎薄弱的初學者,可能在數據了解程度、文字表述以及行文布局方面都缺乏實踐,合理借鑒是非常有必要的。但在“抄”的基礎上,如何用出“心意”和“新意”,你需要思考:
作者為什么此處用這個數據?
是否存在更合適的數據?
在原數據的基礎上是否可以再處理,從而優化解釋力?
其二,先有結論還是先有數據?先有數據,再無偏見的得出結論,這種方式廣泛被認可。如果預設結論,初學者往往會去找可以佐證的數據,忽略證偽的數據,從而導致結論的偏差。但在實際上,“先有結論后找數據”是最高效的方式。舉個簡單的例子,我們認為B站游戲和TapTap是直接競爭對手(這一結論其實可以從與從業人員交流、雙方的布局中感受到)。如此反向推到,則B站游戲和TapTap應該具備如下共同特征:
最受歡迎的游戲應該是二次元游戲;
二者平臺上廣告投放最多的應該是二次元游戲。
我們通過這樣的兩組數據就可以很好的量化證明二者競爭關系。
其三,多思考是最好的訓練。報告是由每組數據得出的結論所串聯,在日常訓練中可以將每組數據對應的結論列在底稿中。如下圖“日本外賣行業市場規模及滲透率”,我們可以得出哪些結論?
日本外賣行業市場規模及滲透率(1975-2020年,千億日元)
我們可以得到初步結論(需要進一步驗證):
日本常態外賣市場滲透率22%左右,由于中日在經濟、人口密度等方面相似,中國外賣市場可以參考此比例;
經濟危機下,外賣業務具有非常強的韌性,1997年亞洲金融危機時期,日本外賣滲透率增長顯著陡峭;
外賣在疫情期間的防御屬性強,2020年日本新冠疫情導致外食率下降25%,而外賣市場規模保持穩定。
通過給每組數據找到多個初步結論是非常有助于思考能力的提升和報告攥寫。
接下來,我們將正式開始“數據的收集、處理和分析”工作:
數據的收集環節包括:
第一是公司定期數據:包括招股書、定期財報中的經營數據和財務數據(海外公司的定期Investor Presentation里面可能有更詳細的經營數據),也包括對其進一步處理的數據,比如“單日活用戶日廣告貢獻”、“單日活用戶營銷支出”等,同一行業不同公司的對比非常有意義。并且定期數據及處理后的數據的可靠性非常高。
第二是行業數據:包括國家統計局、行業權威機構、海外統計數據等(海外公司的定期Investor Presentation里面可能會披露一些行業數據),比如Questmobile的移動用戶數據、AppAnnie的移動游戲流水數據、七麥數據的移動游戲排名、爆量助手的買量以及伽馬數據的游戲行業流水數據等。
這里我們要特別強調一下海外統計數據,不能否認美日韓等發達國家在很多行業數據統計方面更加嚴謹和全面,比如日本餐飲企業外賣市場結構、韓國K12教育滲透及支出情況、美國第三方投顧管理規模及收入、轉基因種子增收情況(ussecinchina.com)。
第三是行業常識:比如移動游戲渠道分成(安卓5:5,蘋果3:7)、養殖行業常識(生豬出欄均重120KG、玉米豬肉轉化比1:2.7左右)等等,這些常識都是了解行業的基礎。
第四是草根調研信息:很多信息沒有高頻、權威的第三方統計,但其又是非常重要的,比如一些非上市公司的經營和財務情況(抖音各項商業化數據)、白酒的批價信息等。
數據的處理環節包括:
第一,加減乘除:
加即合并,比如很多視頻平臺將內容采購納入投資活動現金流中,事實上其與經營活動相關,我們考慮現金缺口時候可以將其加回;
減即剔除,比如騰訊社交網絡收入中包含移動游戲的引流分成,這部分與游戲業務更加緊密;
除即比率和人均,比如滲透率、付費率、電商貨幣化率以及單日活用戶廣告貢獻、單用戶營銷支出鄧。
“除”是最常用的數據處理方式,但要注意除數的選取和意義,單日活用戶廣告貢獻比單月活用戶廣告貢獻更具有現實意義。
第二,相關和回歸:這是數據處理的進階。相關系數高說明兩組數據關系就越強。比如我們通過數據驗證“頭部養殖企業的單豬市值和豬肉價格強相關關系”,都在0.8甚至0.9以上,從而證明了單豬市值法的有效性,并且可以依據這種估值方式得出不同養殖企業的估值水平。我們只需要跟蹤其中一個變量,就可以擬合出另一個變量的變化趨勢。回歸則是將相關關系量化,這種量化關系可以用來預測。
比如我們可以通過“SaaS公司PS和營收增速”的散點圖發現,二者存在正相關,并且通過最小二乘法得到回歸公司,如“PS = A*營收增速 + B”,而我們可以通過已知/預測某公司的營收增速,從而得到合理的PS值。
下面是數據的分析環節:
沒有邏輯的數據只是空殼,沒有數據的邏輯則是空中樓閣。處理過的數據要為結論服務,我們需要解釋數據的差異性和合理性。數據的分析是為了支撐報告的結論,其中包括:
第一是縱向比較:以歷史數據為基礎,找出異常數據并分析原因,比如“2020年第一季度B站MAUs單季度增長大幅提升,系公司戰略發生變化,轉向以用戶增長為導向,加大投入”;或找出歷史數據的規律,比如“游戲行業市場規模與本國GDP高度相關,年度角度,游戲行業不存在口紅效應”等。
第二是橫向比較:以不同行業、公司數據對比為基礎,找出數據之間差異的原因,比如“不同視頻平臺的單日活用戶日廣告貢獻不同,抖音最強、快手次之、B站最弱,背后是用戶時長、廣告加載率、CPM不同所致”;或通過其他行業、公司經驗為本行業、公司提供借鑒(包括不限于天花板、發展要素等),比如“測算TapTap的市場空間,可以通過Steam在端游領域的占比來對比”,當然也不要忽略其中的不同,比如“日本外賣花了30年達到滲透率15%以上,而中國只花了不到10年的時間”。