我的《灰色收入與國民收入分配》研究報告自2010年發表後,引起了不少關注和爭論。其中,羅楚亮、岳希明、李實的一篇文章,對這個灰色收入報告提出了一系列質疑,認為我對灰色收入的估計結果「超出人們常識」,方法上有「比較嚴重的缺陷」,表示「不認可」這項研究(兩文分別見中信出版社《比較》第48輯(2010)和第52輯(2011))。我對這一質疑表示歡迎,並期待學術界更多的討論和研究。鑒於我與三位質疑者在一些基本看法上,及研究方法和治學態度上都存在分歧,有必要對上述質疑作一個答覆。
1. 灰色收入和收入差距是否被誇大
我在灰色收入報告中指出,目前的居民住戶統計數據嚴重低估了高收入居民的真實收入,也低估了收入差距。這有兩個原因。其一,樣本中的高收入居民,有明顯低報收入的傾向,特別是灰色收入,基本上不可能反映出來;其二,現行的住戶統計調查對高收入樣本有遺漏。兩者都會使數據發生系統性偏差。我的報告主要對低報收入的偏差進行了估算和糾正。這是一個初步的探索,未必完善,其中對最高收入居民人均收入的推算可能仍是偏低的。
質疑者承認現行統計數據存在這兩方面問題,但對我估算的收入差距和灰色收入數量提出了嚴重質疑。依據是,既然我的研究只試圖解決低報收入問題,而沒有對遺漏樣本的問題進行糾正,那麼實際上「隱性收入」或「灰色收入」就會更大,「也許大到了讓人難以置信的程度」。他們說,「面對這些超出人們常識的估計結果,讓人不得不理性地對待這些結果的合理性。」
顯然,質疑者首先是不認同我的研究結論,認為我估計的隱性收入和灰色收入都太大了。可惜他們並沒有提出有說服力的論據,而只以含糊的「大到讓人難以置信」、「超出人們常識」作為否定的根據,然後就轉而對我的研究和調查方法進行批評。
在討論方法問題之前,不妨先澄清一下,上述說法是指誰難以置信?超出了誰的「常識」?我的報告發表後,新浪網推出了一項網上調查,截至2011年5月14日,參加調查7918人,認為我的研究高估了灰色收入的佔10.3%,認為沒有高估的佔83.7%。從這些情況看,三位質疑者的常識和大多數公眾的常識有很大差距。
撇開所謂常識和我的推算結果不談,只要仔細看看不同統計數據之間的差異,也能得出理性的判斷。首先,根據統計局住戶收入數據計算,2008年全國居民可支配收入13萬億元,比國家統計局「資金流量表」中基於全國經濟普查計算的居民可支配收入少了5.2萬億元。經濟普查覆蓋面更廣,顯然說明住戶調查數據有大量遺漏。
其次,根據國家統計局的銀行存款、各類投資等統計數據推算,2008年居民儲蓄總額應為11—11.5萬億元,而不是按住戶統計數據推算的3.5萬億元。加上消費,居民可支配收入應在22.1—22.6萬億元之間,而不是按住戶統計計算的13萬億元。請問相差的這9萬多億元是從哪裡來的?以上這種情況,每年都在發生。按2009年數據推算,兩者的差額超過10萬億元。
其三,用歷年商品房銷售統計、汽車銷售統計、居民私人出國出境旅遊統計等數據來推算,居民支出水平都遠超出了居民收入統計能夠解釋的範圍。
無需更多的例證,我的報告是否誇大了隱性收入和灰色收入,本著實事求是的態度,人們是能夠做出合理判斷的。
2. 關於灰色收入課題的研究方法
三位質疑者除了不能接受我的結論,也對我的研究方法提出了許多批評,如我的方法「缺乏穩健的方法論基礎」、「缺乏合理的邏輯基礎」、模型解釋力低、結果的數字不精確、不同方法的推算結果之間有差異,等等。這些理由之間,有些是自相矛盾的,還有一些曲解了報告原意,但指向都很明確,即試圖證明我的分析結果「不可信」、「荒謬」。下面擇要予以回答。
(1)關於「缺乏穩健的方法論基礎」(意思是沒有現成的文獻依據),涉及一個更根本的問題,即怎樣評價一種研究方法的好與壞?在經濟學中有大量問題可以使用學術界公認的現成方法來研究,但還有許多問題是學術界很少涉及,沒有現成方法可用,或只有某些不成熟的方法可以參考。對於這類問題,評價研究方法好壞首先要看其對解決懸而未決的問題有無幫助,而不是看有沒有前人的現成方法作依據。
(2)質疑者對我的模型R2過低提出了批評,這是合理的,也是其十幾條理由中唯一站得住腳的理由。這是這項模型分析的一個不足之處,需要繼續改進。但在這一問題上,質疑者也迴避了兩個重要之點:其一,模型的大多數變數估計值都達到了很高的統計顯著性(1%水平),說明這些解釋變數與被解釋變數間確實存在預期的相互關係;其二,為了檢查結果的可靠性,我用不同的方法和數據進行了交叉檢驗,結果與模型分析法推算結果非常吻合。這些檢驗彌補了模型R2較低的缺點,驗證了其可信度。
(3)質疑者說,用我的分組比較法,再用他們自己的城鎮住戶樣本數據,按收入排序並按累計的恩格爾係數分組、計算人均收入,然後再與平均分組的人均收入進行比較,發現兩者不完全一致,多數組有3%—6%的誤差,最高收入組的誤差有16%。他們由此作出結論:我的方法「不可行」。
首先,不同方法的計算結果間有3%—6%的差異,並非不可接受的誤差。相比之下,國家統計局的住戶收入數據和國民經濟核算中的居民收入數據之間,差了5萬多億元(以2008年為例),誤差率高達30%(以住戶數據為基數則誤差40%)。幾位質疑者多年來使用統計局住戶數據做研究,對這樣巨大而且顯而易見的誤差,不知為何此前從未提出過質疑?
其次,質疑者不會不知道他們使用的高收入樣本(應為國家統計局樣本的一部分)的收入數據是不夠真實的。而對這些收入數據欠真實的樣本按不同方法分組,自然產生較大的不一致。但這是他們自己數據產生的問題。
再次,質疑者還使用了不正確的計算方法。他們計算的分組恩格爾係數使用的不是平均法,而是累計法,這種方法實際上給了不同收入水平的住戶以不同的權重。因此自然產生一定誤差。
(4)質疑者用他們自己的樣本數據,計算了不同省份人均收入和恩格爾係數,發現江蘇各組比甘肅的恩格爾係數更高,而收入水平也更高,兩者相差近一倍。質疑者據此證明,用恩格爾係數推算收入水平的方法,是「荒謬」的。他們沒有提供原始數據和具體計算方法,無法檢驗他們的計算是否正確。但僅從已有信息中,可以發現如下問題:
其一,質疑者使用的數據存在反常。無論是用我們的調查樣本數據還是國家統計局的全國樣本歷年數據,按收入十分組的恩格爾係數都非常有規律地隨收入水平上升而下降。這在經濟學中是有解釋的。而質疑者的江蘇樣本第二、三、四組的恩格爾係數反而都遠高於第一組,第六組高於第五組,第七組高於第五、六組;甘肅第三組高於第二組,第六、七組高於第五組。這樣嚴重反常的情況若不是來自他們數據的質量問題,就是來自他們的計算錯誤。但他們用自己反常或錯誤的數據,想要證明別人的方法「荒謬」,是有點幽默感的。
其二,如前述,質疑者已經知道自己的數據存在高收入居民低報收入等系統性偏差;在未採取任何糾正措施的情況下,進行這種分組比較,自然更不可信。
其三,又如前述,質疑者的恩格爾係數計算方法不正確,這也同樣會影響兩省分組比較的結果。
其四,恩格爾係數不僅與收入水平有關,還和其他一些變數有關(例如教育水平、家庭規模、就業面、地區消費習慣差異等)。我的模型分析法控制了這些變數,分組比較法在我的報告中只是作為參考。而質疑者單挑出分組比較法來,算出某些不正常的結果,是偷換了問題。
5)我在報告中指出,調查發現,高收入居民常常有低報收入的傾向,但他們報告的消費數據偏差小得多。此外當家庭消費被低報時,其食品消費一般也會被低報。而恩格爾係數是這兩者的比值,兩者的偏差是同方向的,能夠互相抵消。因此我們仍然可以得到比較可靠的恩格爾係數。這是我使用恩格爾係數法進行收入推算的前提。
質疑者不會看不懂這些說明,但他們繞開了這些技術問題,籠統地指責我不相信統計局住戶調查數據的真實性,卻相信住戶調查的恩格爾係數的真實性,因此「從一開始就陷入了一種悖論」。這種論證容易誤導讀者,然而是牽強附會的。
3. 關於灰色收入課題的調查方法
質疑者還列舉了很多理由批評我的調查方法,其中許多論點邏輯不清或自相矛盾。歸納一下,大致可分兩類:
第一類批評是想證明我們的調查不如統計局的調查可靠,比如,說我們的調查人員「通常」不能保證其專業性,「至少不能說比國家統計局的調查員更專業」;他們還可能會有「職業道德」問題(言外之意就是問卷造假);我借鑒的社會學典型調查方式「必須滿足一個前提條件:所有的個體都是相同的」,否則就「未必合適」。
這些邏輯都有些奇怪。我們的調查員可能有「職業道德」問題,統計局的調查員就不會有同類問題嗎?在社會科學領域,根本不存在「所有個體都相同」這樣的條件,也沒有任何兩個個體會完全相同。這是一個根本站不住腳的理由。
質疑者的第二類批評,是說我們的調查方式「與國家統計局並沒有實質性的差異」,因此「不能避免國家統計局住戶調查中所存在的問題」,我們的方法「沒有特別之處」,「看不出……有多麼先進」。我的調查樣本與統計局樣本「收入構成也沒有明顯的不同」。質疑者還舉例說,某些採用詢問方式的調查,與統計局的記賬式調查結果「非常接近」。
這些說法,看來是想說明我的調查並不比統計局調查更好,但首先就否定了他們自己的第一類批評,說明所謂我的調查方法比統計局的調查方法必然更不可靠的說法,有強詞奪理之嫌。我們的調查的確「沒有什麼特別之處」,只不過是採取了種種可能的措施保證數據真實可靠。我們舍棄隨機抽樣調查方式,而採用了針對調查員熟悉和瞭解家庭情況的人群的定向調查方式,並選擇匿名調查,就是為了取得更真實的數據。我們還對受訪者作了並認真執行了信息保密承諾。我們在調查方法和問卷設計上考慮了受訪者的心理反應,這樣即使受訪者試圖低報收入,也很容易從分項支出數據中發現問題。我們還慎重選擇了調查的合作對象,規範了調查員資質和經驗,認真對各地調查員進行了直接培訓和調查指導,及時跟蹤處理了調查中遇到的問題,並對調查結果進行了嚴格的質量檢查。相信一些「公事公辦」的調查,未必能做到這樣的認真程度。
這裡有必要回答幾個被重點質疑的問題。
(1)調查人員直接調查自己熟悉和瞭解其家庭經濟狀況的人群,真能提高調查數據的可靠性、避免低報收入嗎?
質疑者表示不相信。還有人說,這反而會增加受訪者低報收入的傾向。但這畢竟是他們的主觀想像。看調查結果,我們的中、高收入樣本在同等消費特徵的情況下,報出的收入水平顯著高於統計局樣本的收入水平。而且收入水平越高,差異越顯著,規律性非常明顯。這一結果本身明確否定了質疑者的上述想像,說明我們的調查方式和輔助措施有利於提高數據的真實性。
(2)無記名調查方式是否會增加調查員問卷造假的可能性?
無記名調查會減少受訪者的顧慮,有利於獲得真實信息,但對問卷的質量保證又是一個不利條件。如沒有適當的質量控制和檢查措施,可能增加造假的概率。對此,我們選擇了有良好誠信記錄的合作夥伴;對調查員的文化程度、工作態度、調查經驗和當地生活背景都提出了明確要求;在培訓中強調了杜絕造假的紀律和保證數據真實性的意義;加強了對調查過程的監督和事後覆核;並通過嚴格的問卷質量核查剔除了相當一批有疑問的問卷。實踐證明,這些措施是有效的。
(3)我們是怎樣對問卷進行核查的?
調查過程的核查:所有調查員在完成每份問卷調查後,都必須按要求填寫詳細的調查後記,陳述他(她)與每位受訪者之間的關係、互相瞭解的程度、調查時間和過程、受訪者對調查的態度、以及調查員對問卷一些主要信息可靠程度的判斷。這些給調查督導控制質量、判斷信息的真實性提供了幫助。有些不合格的問卷,在督導核查過程中就篩除了。
問卷的事後核查:包括信息的完整性檢查、一般邏輯檢查、及收支關係檢查。後兩者主要針對受訪者提供不真實的信息,和個別調查員進行造假的可能性。通常,提供虛假信息者很難保證整個問卷信息前後一致,不發生邏輯矛盾。我們設計了專門的檢查程序對逐個問卷進行檢查。結果在4909份問卷中剔除了714份質量不合格的問卷,約佔15%。這些嚴格的檢查,在總體上保證了調查結果的可靠性。
4. 請勿誤導讀者
在學術討論中,應該本著客觀誠實的學術態度,切忌弄虛作假、誤導讀者。而質疑者的若干批評,有失上述準則。僅舉兩例:
(1)為了證明我的研究不可信,質疑者說,我「把所有低報的收入都算作‘灰色收入’」,而且根據我的推算,「最低收入居民的灰色收入增長最快」。這一批評是無中生有的。我在研究報告中明確區分了「隱性收入」和「灰色收入」。前者指居民收入統計沒有反映出來中的收入,後者指「無法明確界定、不能清楚地判斷其合法或非法的收入」。我推算的2008年居民隱性收入為9.3萬億元,灰色收入為5萬億元。在分布上,我的結論很明確:隱性收入和灰色收入的80%以上都集中在佔城鎮家庭20%的高收入居民。我推算的最低收入居民收入和統計數據也有較小的差異,但這基本上是普通的統計遺漏和誤差,而不是什麼灰色收入。
而質疑者卻把這些小額遺漏和誤差項,牽強附會地解釋成所謂「最低收入居民的灰色收入」,還別出心裁地用兩個不同年份的最低收入居民遺漏和誤差項相除,計算出一個所謂「最低收入居民的灰色收入增長率」。這更遠離了我的原意。
質疑者還刻意避開了我所採納的模型分析法結果,而用我沒有採納的、誤差較大的2008年分組比較法結果,去和2005年結果相除,算出一個所謂「最低收入居民的灰色收入增長最快」的結果,試圖證明我的推算何等荒謬。但這種論證不僅方法荒謬,而且不誠實。
(2)質疑者的另一個理由,是說根據我的數據計算,中國的基尼係數高達0.685,「把所有的拉美國家都拋在了後頭」。因為中國的情況不可能這麼壞,由此證明我的研究結果是荒謬的。
但質疑者的這些「計算」,背離了基本的學術準則。
首先,他們改變了我的數字。我推算的2005和2008年城鎮居民人均收入與統計局數據的差異,分別是1.78倍和1.90倍(見原文表8),而他們卻說是2.53和2.25倍。僅這一點,就會使基尼係數的計算相差甚遠。
其次,要計算全國居民收入的基尼係數,必須有城鄉合一的樣本數據。國家統計局歷來的城鎮住戶和農村住戶調查都是兩個互不銜接的樣本,且從未公布原始數據。我計算的是城鎮居民分組收入,沒有涉及農村。而僅僅根據這七組城鎮收入數據,無法計算全國基尼係數。因此我自己從未做過這樣的計算。而質疑者聲稱對我的數據進行了「變換」,又與他們自己的農村樣本「合併」,從而計算出了一個0.685的「基尼係數」。他們根本沒有說清楚,怎樣能夠把城鎮分組數據「變換」成原始樣本數據,又怎樣和農村的樣本數據進行「合併」,只是提供了一個含糊不清的「計算公式」來進行所謂的「變換」,但連公式的含義、理論依據、計算過程、變數各自代表什麼都一概沒有交代。要把分組數據「變換」回樣本數據,就像要把煮好的麵條「變換」成原來的小麥。這在理論上肯定站不住腳,在計算上必然漏洞百出。想用這種經不起檢驗的「論證」來推翻他人的研究,本身是不能成立的。
順便說說,如果在可靠的數據、合理的方法的基礎上,真的計算出了一個很高的基尼係數;如果客觀數據及研究結果與我們頭腦裡先入為主的觀念發生衝突,我們應該更相信客觀的研究結果,還是相信自己的主觀感覺?如果只相信後者,我們為什麼還要做研究?
最後,我們說中國存在灰色收入問題,存在低估收入差距的問題,並不意味著其他國家不存在同類問題。因此對灰色收入的研究,也應該是一個有國際意義的課題。但我們既不應該因為自己的問題嚴重而拒絕承認,也用不著以別人有類似的問題而暗自慶幸,需要的是客觀面對和解決自己的問題。
来源:財新網
短网址: 版權所有,任何形式轉載需本站授權許可。 嚴禁建立鏡像網站。
【誠徵榮譽會員】溪流能夠匯成大海,小善可以成就大愛。我們向全球華人誠意徵集萬名榮譽會員:每位榮譽會員每年只需支付一份訂閱費用,成為《看中國》網站的榮譽會員,就可以助力我們突破審查與封鎖,向至少10000位中國大陸同胞奉上獨立真實的關鍵資訊, 在危難時刻向他們發出預警,救他們於大瘟疫與其它社會危難之中。