核心觀點
核心觀點:2023年以來,美國非農就業數據出現頻繁、大幅的“修正”,引發市場對於美國就業數據真實性的質疑。我們從非農數據修正的原理展開,發現數據的修正更多源自調查問卷反饋的滯後、不同調查統計的口徑分歧、估算模型的失真等問題,而非刻意“粉飾太平”,但也同時反映了美國就業市場存在的小企業經營惡化、非法移民對就業的貢獻等現象。2月7日公佈1月非農就業數據時,BLS將就2024年全年數據進行修正,我們預計此次數據的下修幅度可能是很大的、同時失業率存在上修風險,屆時需要關注數據修正給市場帶來的負面衝擊。
月度修正:每月BLS公佈美國非農就業數據時,會同時修正前兩個月的數據,這一頻繁的數據修正與其編制方法密切相關,即企業存在延遲反饋問卷的現象。疫情危機後,CES企業調查的初次反饋率持續下降,同時非農的下修變得愈發頻繁。這一現象背後的真相可能是:小型企業的經營狀況開始變差,反饋問卷也更加怠慢,而那些更糟糕的延遲反饋問卷造成了數據的下修。因此,近期非農頻繁的下修雖說是一個“技術問題”,但也側面反映了在美國經濟下行週期的背景下,小型企業經營環境惡化的現實。
基於失業保險的校準。BLS在每年2月會對上一年全年數據做出全面的“年度校準”,其內容包括基於失業保險數據、企業生死模型、人口普查數據進行的校準。其中,爲了彌補CES調查樣本的有限性問題,BLS根據基於企業失業保險記錄的就業和工資季度普查數據(QCEW),在次年2月對非農就業進行年度校準。23H2以來,QCEW就業與CES非農就業之間的分歧不斷加大,這或與不同問卷對非法移民的統計有關:QCEW基於失業保險數據,難以捕捉到非法移民,且不存在CES調查對兼職就業的重複統計問題,而這正是疫情後美國新增就業的重要貢獻之一。因此,2024年8月BLS基於QCEW對2024年3月數據初步校準的大幅下修可能是“矯枉過正”的,即忽略了非法移民的就業。
基於生死模型的校準。企業成立與倒閉對就業淨增長存在影響,但其在就業統計中存在滯後性,對此,BLS引入企業淨出生-死亡模型(NBD),對這一效應進行估算。每年2月,BLS同樣會對上年NBD的預測數據進行校準。2024年2月BLS的校準顯示,截至2023年3月,NBD模型累計高估了330萬的總就業。這一現象與模型假設有很大關係:NBD模型假定因企業成立與倒閉帶來的淨就業增長趨勢相對穩定,而疫情危機以來,美國新註冊企業數目增速大幅加快。隨着近期新註冊企業數目的降低,NBD模型給非農帶來的高估也面臨着更大的下修風險。
基於人口普查的校準。除去CES企業調查,BLS也會在每年2月對家庭調查(CPS)數據進行校準。CPS的年度校準主要來自人口控制方法,該方法基於最新的人口普查、淨移民等數據進行校準,並對失業率等數據產生影響。2024年12月19日,人口普查局更新的統計數據上修了美國移民人口,這將體現在最新年度調整中對CPS數據進行的調整中。
2024年度大校準前瞻。2月7日,美國勞工部將公佈1月非農數據,並對2024年數據做年度校準。我們認爲此次數據需要尤其關注以下兩點:①2024年的新增非農就業是否大幅下修,幅度是多少?②2024年的失業率是否上調?對於非農就業,我們通過對比不同非農問卷口徑下2024年的美國勞務市場新增就業,預計截至2024年12月,美國非農總就業人數或存在93-154萬的下修,這較2024年3月81.8萬的初步校準有所增加。對於失業率,由於本次人口普查局的更新統計主要將南部邊境的移民數據納入統計,而這一羣體的失業率遠高於均值,因此納入新的非法移民數據意味着2024年美國失業率可能將迎來上調。
風險提示:模型風險;統計風險;樣本風險。
內容目錄
1. 月度的小修正
2. 年度的大校準
2.1. 基於失業保險的校準
2.2. 基於生死模型的校準
2.3. 基於人口普查的校準
3. 2024年度大校準前瞻
4. 風險提示
2023年以來,市場關於美國非農數據“頻繁修正”的討論持續升溫,國內外很多機構開始質疑美國非農就業數據的真實性。例如,2023-24年公佈的23期非農數據中,有16期數據在首次修正中出現了下修,佔比70%,而這一比例在1964年以來的721期非農中爲46%。再例如,2024年8月,BLS將2024年3月的非農總就業人數進行修正,修正後的新增非農較此前減少了81.8萬人,是1979年有該修正以來的第二大下修幅度。Powell在9月FOMC發佈會上表示,此次修正暗示美國就業數據可能被人爲調高且將被下調(…suggests that the payroll report numbers that we're getting may be artificially high and will be revised down)。那麼,美國非農就業數據近期頻繁修正的原因是什麼?後續是否還會有較大幅度的修正,給市場帶來一個又一個的“驚喜”?
本報告將首先就美國非農數據修正的原理展開分析,接着再論證非農修正只是因爲“技術原因”還是拜登政府在背後“粉飾太平”。最後,2025年2月7日公佈1月非農就業數據時,BLS將就2024年全年數據進行修正,我們將分析論證這次數據的下修幅度可能是很大的,屆時需要關注數據修正給市場帶來的負面衝擊。
1. 月度的小修正
美國非農數據的修正可大致分爲兩類:①每月非農數據公佈時對前兩個月數據進行的修正,即月度的小修正(revision);②每年2月對上一年全年數據做出的全面校準,即年度的大校準(benchmarking)。每年8月,BLS還會對當年3月的數據做一次初步校準。市場平時所討論的非農數據的頻繁下修,多爲月度的小修正。
事實上,每次公佈非農數據時,前兩個月的非農數據都會被修正,這也是爲何市場經常參考“三個月平均”新增非農數據的一個原因。而月度非農之所以會出現頻繁的修正,其實和美國非農數據的編制方法有密切關聯。從編制原理上看,這是一個純粹由“技術問題”導致的修正。
月度公佈的非農數據來自美國勞工部統計司(BLS)企業問卷(Establishment Survey)獲取的當前就業數據問卷(CES,Current Employment Statistics)。BLS一般在每月包含12號當週通過電話、電郵、EDI三種途徑蒐集數據。50人以上的大型公司一般採用EDI(Electronic Data InterChange)蒐集,受訪者通過提交特定、統一格式的電子文件上傳數據,而電話、電郵則針對小型公司。雖然BLS每月發放問卷的時間是準時的,但受訪者回答的時間卻不一定是及時的,這就導致了部分問卷要多等1-2個月才能反饋。也正因如此,BLS纔會對每個月公佈的非農數據進行2次修正。例如,2024年10月企業問卷首次收集率只有47.4%,但二次、三次收集率分別高達92%、93.5%。正是延遲反饋問卷的存在,導致BLS不得不在獲得這部分問卷後重新對此前的數據進行修正。
但疫情危機後,越來越多的問卷未在第一時間反饋給BLS。圖2可見,2020年以來,CES的首次收集率從70%迅速回落至60%,但二次、三次收集率則在90%附近保持穩定。單從疫情後的數據來看,CES問卷反饋愈發拖沓的同時,非農的下修開始變得愈發頻繁,即後反饋的數據顯示出的就業情況更差。現實情況中,大型企業通過EDI反饋,時效性一般較強,但通過電話電郵等方式受訪的中小企業很難說有專設的相關崗位,因此更容易出現問卷反饋的延後。而從ADP統計的不同規模公司的就業總人數變化來看,1-19人的小型公司在23H2便開始縮編(圖4)。因此,疫後美國非農數據頻繁下修背後的真相可能是:小型企業的經營狀況開始變差,最早出現了縮編與裁員。這也導致小型企業在反饋問卷時也變得更加怠慢,使得問卷首次收集率大幅下降,而在BLS在拿到這些延遲反饋的結果更糟糕的數據後,便相應對數據進行了下修。因此,近期非農頻繁的下修雖說是因問卷設計導致的一個“技術問題”,但也側面反映了在美國經濟下行週期的背景下,小型企業經營環境惡化的現實。
2. 年度的大校準
除去月度的小修正外,年度的大校準發生頻率更低,但修復幅度也相對更大。2024年8月,BLS根據最新公佈的普查數據將2024年3月的非農總人數下修了81.8萬,佔非農總人數的0.5%,是1979年以來第二大幅度的下修(圖6)。此外,由於原定於北京時間22點就應公佈的數據校準被無故推遲到了22:37才公佈,市場對BLS“數據作假”的質疑變得更深。
2.1. 基於失業保險的校準
前述我們提到,月度公佈的非農數據來自調查問卷,而調查問卷反饋的延遲導致了數據的修正。作爲調查問卷,CES僅僅覆蓋了美國30%的就業人員,因此其不可避免地存在統計誤差。爲解決這一問題,每個季度BLS會基於企業的失業保險繳納記錄生成就業和工資季度普查數據(Quarterly Census of Employment and Wage, QCEW),該普查數據覆蓋97%的美國企業,剩餘3%通過人口普查局的其他數據補全。
因此,在每年8月當年一季度的QCEW數據發佈時,BLS將對當年3月的就業數據進行“初步校準”,隨後在次年2月進行“年度最終校準”。由於基於CES的非農數據是基於對11.9萬家企業的抽樣調查,而基於QCEW的就業數據是基於對1160萬家企業的普查數據,因此兩份數據時常存在差異。如圖7,23H2以來,非季調的QCEW口徑下的就業人數與CES非農之間的軋差不斷走闊。截至最新2024年6月,QCEW、CES非農分別對應的就業同比增速分別爲0.81%、1.59%。
那麼,爲何23H2以來CES與QCEW的分化開始加劇?對2024年3月的初步校準又爲何會出現如此大幅度的下修?我們認爲這或與不同問卷對非法移民的統計有關。作爲普查數據,QCEW統計的依據是失業保險。而拜登政府時期引入的非法移民並不具備合法身份,因此無法獲取失業保險,意味着他們難以被統計數據覆蓋。此外,CES非農在調查時詢問的其實是新增崗位數,如果湧入的非法移民在不同的企業身兼數職,則非法移民很可能被重複統計。
例如有40萬非法移民湧入美國。他們上午在肯德基、下午在麥當勞兼職,則CES非農問卷統計到的是80萬就業,而由於這40萬非法移民都未繳納失業保險,因此QCEW統計到的新增就業爲0,這就導致BLS在拿到普查數據進行校準時,會對數據進行大幅下修。從數據上看,根據CBO估算,受拜登政府放開非法移民政策影響,2022-24年美國每年預計新增移民267、330、330萬人,顯著高於2004-2020年99萬的均值(圖8)。而這些湧入的非法移民多在教育醫保行業中的社區醫院兼職護工、休閒餐旅行業中的餐廳兼職服務員(圖9),因此很容易被CES問卷重複統計,但無法被QCEW問卷捕捉到。因此,2024年8月BLS基於QCEW對2024年3月數據的初步校準可能是“矯枉過正”的:正是QCEW與CES非農問卷一個低估、另一個高估了非法移民帶來的就業影響,才導致初步校準出現瞭如此大幅度的修正。
2.2.基於生死模型的校準
每時每刻美國都有新的企業註冊成立、新的企業破產註銷,因此BLS在統計就業時會存在一個很現實的問題:新註冊成立的企業經過登記、納入樣本、信息處理等流程,最終出現在CES企業調查樣本上的時滯長達一年多,因此月度的非農問卷很難統計到這些新成立的企業信息和其帶來的就業。對勞務市場而言,就業與失業變化來自兩部分:存量企業的擴張與縮編,以及企業的成立與倒閉。如圖10,截至最新24Q2,對生產與非管理崗的私營部門而言,由企業擴張帶來的就業、縮編帶來的失業分別爲604、616.2萬人,而由企業成立帶來的就業、倒閉帶來的失業分別爲155.1、159.2萬人。由企業成立與倒閉帶來的就業波動不容忽視。這意味着,BLS在計算就業變化時,必須考慮企業成立與倒閉帶來的影響。而相對於擴張與縮編,由企業成立與倒閉帶來的淨就業增長趨勢相對穩定(圖11)。這一特徵意味着,只需要估算新註冊企業帶來的就業增長,即可捕捉到企業“生死”給勞務市場帶來的波動,這即BLS所用淨出生-死亡模型(Net Birth-Death Model, NBD)的原理。例如,當前美國有100家企業,同時新成立、倒閉了5家企業。因此BLS會對95家存量企業進行調查統計,同時通過NBD模型預測5家新註冊企業帶來的就業增長。
如圖12,2023年以來,非季調口徑下,由NBD模型根據新註冊企業帶來的就業貢獻了美國40%的新增非農就業。換言之,這部分就業並非來自BLS的非農問卷調查,而是純粹來自NBD模型的預測。每年2月,BLS會對上年NBD的預測數據進行校準。如圖13,2024年2月,BLS對2022年4月至2023年3月NBD模型的預測值進行了校準,校準後的數據顯示,到2023年3月,NBD模型累計高估了330萬的就業。
NBD模型爲何會高估非農就業?這與模型假設有很大關係。如前述,NBD模型假定企業成立與倒閉帶來的淨就業增長趨勢相對穩定,而2020年以來,美國新註冊企業數目增速加快(圖14)。2021年以來,新註冊企業數目明顯高於新註銷企業,這導致美國企業淨增加數顯著增多(圖15)。Richmond聯儲工作論文顯示,這一趨勢反映的並非企業創業情緒的提升,而是疫情造成的工作生活方式變化帶來的企業重組。而隨着新註冊企業數目的降低,NBD模型給非農帶來的高估也面臨着更大的下修風險。
2.3.基於人口普查的校準
除去企業調查問卷,BLS也會在每年2月對家庭調查(Household Survey)的當前人口問卷(Current Population Survey, CPS)進行校準。CPS主要用於編制失業率、勞動參與率、就業率等數據。CPS每月通過上門、電話訪談等形式獲取約10.5萬名 16 歲及以上居民的就業信息,因此數據的反饋是即時的,不存在類似CES的每月修正。
CPS的年度校準主要來自人口控制(population control)。該方法由美國人口普查局制定,主要基於最新的人口普查、出生死亡、淨移民數據進行校準,並在十年一次的人口普查更新後引入新的人口基數並進行相應調整。以2024年1月數據爲例,1月數據採用2024年新的人口控制,導致其與2023年12月數據不可比。因此,CPS同時公佈了2024年人口控制對失業率等主要數據的影響(圖16)。此外,CPS還會對2023年12月的勞務市場數據應用新的人口控制模型進行修正(圖17)。2024年12月19日,人口普查局更新的人口普查數據上修了移民人口,表示2023-24年美國淨增加了280萬移民,並將在最新年度調整中對CPS數據進行相應調整。
3. 2024年度大校準前瞻
2025年2月7日,美國勞工部將公佈1月非農數據,並對2024年數據做年度校準。我們認爲此次數據需要尤其關注以下兩點:①2024年的新增非農就業大幅下修;②2024年的失業率是否上調。
首先需明確的是,基於QCEW的年度校準針對的是全年每個月的數據。例如2023年度校準中,BLS將2023年3月基期數據下修了26.6萬,而校準後的2023年12月數據較此前則高出11.5萬(圖18),背後原因在於,每個月非農的誤差具有一定的隨機性,QCEW在校準時會對部分時期的非農就業數據做出上修、對另一部分時期的非農數據做出下修。如圖19,2023年6月的新增非農較此前上修13.5萬至24萬,而3月新增非農則較此前下修7.1萬至14.6萬。
2024年度校準後,新增非農的下修幅度是多少?我們通過計算不同非農問卷口徑下2024年的美國勞務市場增加了多少就業來回答這個問題。2023年12月至2024年12月,美國非農就業總人數增加223萬至15954萬,同期調整後CPS(BLS編制的、用於與CES可比的CPS數據)增加58.9萬至15523萬(圖20),即整個2024年CES非農較調整後CPS多增加了164萬就業。若與最新QCEW數據對比,則CES非農多增加了154萬就業。若由此簡單推演,到2024年12月,美國非農就業總人數將出現154-164萬的下修。而根據彭博經濟的模型預測,本次QCEW與NBD模型將分別下修70、23.4萬的非農就業,即對2024年12月非農就業總人數合計帶來93.4萬的下修。因此,2024年12月的非農或存在93-154萬的下修,這較2024年3月81.8萬的初步校準有所增加。
2024年度校準後,失業率的上修幅度是多少?2024年度校準中,BLS將根據人口普查局更新後的人口數據對2024年的CPS數據進行人口控制。而本次人口普查局主要將南部邊境的移民數據納入統計,這使得2022-24年的淨移民數量大幅增加(圖23)。根據人口普查局測算,2023-24年間有280萬淨移民流入美國。由於南部邊境移民多爲拉丁裔,而拉丁裔的失業率遠高於均值(如圖22,截至最新2024年12月,美國拉丁裔失業率爲5.13%,較4.09%的失業率均值高出1.04%),因此納入新的非法移民數據意味着2024年美國失業率可能將迎來上調。根據高盛測算,這將導致失業率上修4bps。
4. 風險提示
模型風險:BLS公佈的美國非農就業數據編制依賴於淨出生-死亡模型等複雜的統計學模型,模型參數的大幅調整可能加大分析誤判的風險。
統計風險:近年來,企業和家庭調查的響應率持續下降,可能導致數據質量下降和統計誤差擴大。
樣本風險:非農就業數據主要覆蓋合法就業,可能低估非法移民、零工經濟從業者等羣體的就業情況。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。