如今預測市場開始成為發展大趨勢。預測市場上,人們總是通過預測來做出不確定的決斷,比如設想一部電影可能會熱賣,猜測某位政治人士將成為下任總統,或是推斷股市到底是上漲還是下跌。很多文章已經對預測市場的準確性進行了探討,媒體也常撰文描述各種預測比所謂的內行還專業。
但預測市場還不夠理想。市場需要人為經營和管理。被建立起來后,如果涉及到貨幣交易,例如在購買股票時,就必須有人來保證交易者的資金能夠有序地在市場上流通。沃頓商學院教授阿爾伯特?塞茲(Albert Saiz)和尤里?西蒙遜(Uri Simonsohn)發現了一個更便宜的信息渠道,即網絡搜索(Internet search),它在某種程度上具有和預測市場一樣的功效。
房地產學教授塞茲和運營及信息管理學教授西蒙遜在最近的一篇論文中明確指出,在某個區域,網上所討論話題發生的可能性與現實世界中的相關現象是有聯系的。“我們對‘群體智慧’很感興趣。這種群體智慧是大眾對于某個值得探討的問題的觀點集合。”兩位教授在文中寫道,他們文章的題目叫做《通過在線群體下載智慧》(Downloading Wisdom from Online Crowds)。例如,若想了解人們認為哪些國家以及美國哪些州和大城市最腐敗,他們就會在一個叫做Exalead的搜索引擎中輸入相關信息,通過比較同一頁面上各地含有“腐敗”字樣的條款數目,就可得出相應的腐敗狀況排行。
所得結果毫不驚人。人們普遍認為最腐敗的國家是尼日利亞、塞爾維亞和海地,而美國最腐敗的州是新澤西、紐約和伊利諾斯,最腐敗的大城市為芝加哥和新奧爾良等。
西蒙遜指出,根本沒辦法確定這些地方到底是否腐敗。他們的搜索結果顯示,網上的很多信息表明這些地方和腐敗現象聯系密切。
但人們確實經常談論某地常出現的問題,并為之憂心。比如人們會擔心佛羅里達州的美洲鱷傷人事件,但不會擔心緬因州出現類似問題。因為事實上,鱷魚襲擊在佛羅里達州更普遍,雖然自1984年以來只報道過一例鱷魚致人死亡事件。
正如兩位學者在文中所述,“試想,當一個現象發生得越頻繁越持久時,那么它被關注并被記錄下來的可能性就越大。通過統計有多少人對某個現象做出了記錄,就可得知該現象發生的頻率如何了。”
為盡可能多地搜集例子,塞茲和西蒙遜并不僅限于研究媒體報道。他們還研究了大量文獻,并再次驗證了自己的研究結果。“我們收集了許多新聞資訊,但同時也找了很多政府文獻。”西蒙遜說到,“此外,當我們開始研究社會指標時,例如統計一個城市中非洲裔美國人或西班牙裔美國人的數量,我們發現很多文獻都是由文化機構及博物館撰寫的。”
這也是為何西蒙遜認為他們的研究都是有據可查的,而不是無稽之談,不是網絡博客及聊天室里討論的那些傳聞。“傳聞都很短暫,但我們看到的資料卻都有長期記錄。”他說到,“我本以為會收集到很多博客文章,但實際上卻遠沒我們想象的那么多。”[page]
度量社會趨勢
事實上,很多城市和州的主要社會人口學特征兩位學者的文章清晰地展現了一些固定模式,反應出。具體說來,塞茲和西蒙遜查看了網上各主要州和城市名下含有“非洲裔美國人”、“西班牙裔美國人”、“移民”、“貧困”以及“兇殺”等關鍵詞的信息數量。他們發現,很明顯,某地某種現象實際發生的頻率與網上該信息討論的頻率有正相關的關系。例如,各城市中西班牙裔美國人的比例與該城市網上討論相關信息的文章數量成正比。這種關聯在美國各城市和各州都普遍存在。
因此,塞茲和西蒙遜指出,相關網絡信息出現的頻率可用來衡量當前主要社會現象在各城市或州發生的狀況排行情況。兩位學者還想知道,是否能用這種手段來衡量一個較難度量的變量,例如腐敗現象。
西蒙遜表示,他與塞茲認為自己的研究成果證明了一種有用的技術,可以幫助社會學家及有興趣度量城市社會趨勢的人們進行研究,而不是為了確定地說明哪個地方有多少警察或政客在搞腐敗。所以,在洛杉磯不適合出售房產,因為洛杉磯在塞茲和西蒙遜的腐敗排行榜上高居榜首(但是圣誕節時向警察慈善協會(Police Benevolent Association)捐款卻是明智之舉)。
兩位學者將他們制定的國家網上腐敗排行與透明國際(Transparency International)發布的年度腐敗情況排行結果做了對比。透明國際是柏林一家非營利性機構,通過對商界人士、專家等的民意調查得出腐敗印象指數排行榜。透明國際得出的也是對各國腐敗狀況的感官認知,而不是針對某一確切的腐敗事件。
塞茲和西蒙遜發現,他們的研究結果大多與透明國際的排行結果相同,只是在冰島的排行問題上出現了例外。塞茲和西蒙遜將冰島排在了最腐敗的國家行列里,而透明國際卻將其排為第二大最清廉國家,僅次于芬蘭。“在冰島問題上我們犯了個大錯誤。”西蒙遜承認,“我們認為,這是因為多年來冰島一直被認為是最清廉的國家之一。雖然人們說了很多冰島的腐敗問題,但仍將它作為最佳清廉典范,而不是最腐敗的國家之一。”
由于沒有類似透明國際的機構對美國各州及各城市的腐敗狀況做出調查,因此塞茲和西蒙遜不得不尋找其他辦法來支持自己在美國腐敗問題上的研究。他們將研究結果與各州公務員的平均犯罪狀況做了比較,并再次得到了積極的驗證。他們將內布拉斯加州列為最清廉的州,同時還發現該州的公務員犯罪率相當低。與之相反,新澤西州的腐敗狀況就嚴重得多,并且公務員犯罪率也相對較高。換句話說,電視劇《黑道家族》(The Sopranos)將背景設在新澤西州不是沒有道理的。
至于城市的腐敗排行,塞茲和西蒙遜就要費更大的勁來驗證自己的研究結果,因為沒有其他來源的信息可作對比。但這也促使他們深入發掘人口統計學和社會經濟學數據,并最終發現西蒙遜提到的信息關聯性比腐敗城市排行榜要更有說服力。
“鑒于之前的研究顯示,讀者在看腐敗排行榜時,傾向于關注排行的名次,而忽略了造成各地腐敗差異的內在連續變量。因此我們在評判城市腐敗程度時,按10個城市一組進行排行,并不透露各組內城市的排行情況。”兩位研究者寫到。“前十位城市與我們之前的研究結果相符,其中包括圣地亞哥、新奧爾良、洛杉磯、費城以及芝加哥。”
隨著不斷深入研究數據,兩位學者還以自己的衡量方式發現,貧困的城市更易出現腐敗,比如東北部的城市即是如此。另外,大城市也更易腐敗,但是,政府部門較大(按公共部門人數所占比例來算)的城市并不如此。[page]
推出新的游戲平臺
“種族繁多的城市(按非洲裔美國人和外籍居民劃分)似乎腐敗程度更嚴重。”他們補充到。“黑人和移民更易成為腐敗政治的犧牲品。這種腐敗官員借機剝削壓迫少數民族及外籍移民的情況跟我們之前調查國家腐敗狀況時的研究結果一致,同時也與美國歷史上對腐敗事件的描述相符。美國政客一向肆意壓迫種族隔離區的人們以獲取收益。”
社會經濟指標與腐敗間的聯系,使人們在衡量社會趨勢時會對塞茲和西蒙遜的方法感興趣。例如,可以通過統計網站上中國地區信息中出現了多少次“污染”這個詞,來判斷中國的污染狀況。在中國污染問題上,尚不清楚目前的官方數據是否可靠,而使用塞茲和西蒙遜的方法,可以對中國各地污染引起人們關注的情況有個大致了解。
二人的研究表明了一種當不同的人以各種方式生成的大量文本信息的情況中,一種重復出現的數據模式。社會學家也許可以用網絡信息出現的頻度為代表,來研究當地的社會發展趨勢,否則的話,采取其他方式則很難對這種趨勢進行衡量。
而網絡信息還有其他商業用途。西蒙遜談到,一些精心設計的網絡搜索可以使得經營者事先了解業務發展狀況,從而幫助他們節省資金。像索尼(Sony)這樣的公司在推出新版電子游戲主機之前,可以先對網絡上的相關信息進行評估。“索尼推出新的游戲平臺時,將涉及到龐大的物流問題。”西蒙遜說到,“比如他們要考慮應向哪個城市發送較多的機器。如果在新機上市前,索尼在網上對不同城市的需求信息做過評估比較,這樣就能夠調整送貨數量,保證需求量最大的城市能得到最多的游戲主機。”事實上,像Nielsen Buzzmetrics之類的企業已經開始使用網上消費者信息,來協助公司的銷售業務發展了。
而像政治顧問這樣,最終是以推銷人而非物為目的的職業,同樣可以使用此項新技術。他們可以通過統計哪些人群在網上對候選人及其競爭對手使用的褒貶用語,來獲知人們的觀點看法。接著他們就可以進一步有重點地進行調查或使用焦點小組進行調研了。
此項研究的一大附帶成果是,讓我們有機會對塞茲和西蒙遜使用過的各種網絡搜索引擎做一比較。首當其沖的就是Google。“Google無法進行單個項目的自動搜索。”西蒙遜說。最終他們選擇了Exalead,這是個法國的搜索引擎,但可使用英語版本。他們認為Exalead和Ask.com最可靠。“我們發現Yahoo是最不可靠的。”西蒙遜又說到,“你今天查過某個信息后,下周再查相同的信息時,就會發現不同信息的數量能相差數百萬頁。我覺得這數百萬條新文件是不可能在一周內產生的。”
相關閱讀