beplay2网页登录
beplay2网页登录
袁振國:大學排名不嚴肅、不科學、不可信
2019-02-15 09:25
中國教育三十人論壇
作者:袁振國

  關於“大學排名風險”,我想就八個問題做一個簡要的介紹:

  第一,我們為什麼做這件事;第二,現在大學排名的情況;第三,為什麼要選擇四大排行榜;第四,四大排行榜的共同特征;第五,大學排名的報告框架;第六,觀點和結論;第七,六大風險;最後是態度和建議。

  首先,我們為什麼要做這個事情?評價對教育起到很大作用,在促進教育改革和發展方麵也會起好的作用,但是任何事情都是雙刃劍。總書記在全國教育大會上把教育評價的問題作為重要問題提出來,可見這個問題不是局部的、短暫的和次要的問題,而是成為非常主流的問題了。

  我們為什麼要研究大學排行榜的問題,為什麼要做這個工作?一句話,太熱。

  如果學者做了一些大學的分析、評價,甚至於排行工作,這無可厚非,可以作為學生、家長選學的參考,學校可以作為辦學自我診斷的參照,政府作為資源配置的借鑒的話是可以的。

  問題在於大學排行榜現在熱到了超出了排行榜本身的功能,熱到已經承擔不起這個責任了。因此我們要降一點溫,要潑一點冷水,讓大家對這個問題有一個理性、清醒、獨立的認識。

  說大學排行榜太熱有什麼根據?如果你搜索一下排行的話,在各類網站、很多媒體上都把它作為吸引眼球的重要內容;第二,媒體各種關於排行榜的信息讓學校普遍焦慮。

  現在大學排名是什麼情況?大學排名不隻是中國有,在世界範圍內都非常熱,非常容易就能列舉出50多個經常發布排行榜的機構和名單。

  既然有這麼多的排行榜,我們為什麼選這四個呢?因為這四個熱度最高。很多政府文件、大學宣傳、媒體報道都把這四個作為它們的依據。

  我看到很多大學已經把提升排名作為了一個任務。有些大學總是提自己是前一百名,就像總是提自己是985、211大學一樣。我國大眾主要看中的也是這四個,所以我把這四個拿來進行分析。

  這四個排行榜就是U.S.News、QS、THE、ARWU。

  這四個排行榜有什麼共同的特點呢?盡管它們在出發點和理念上所使用的標準、權重的安排都有不一樣,但是都有若幹的共同特征,而這些共同特征是特別值得我們警惕的。

  第一個,導向不可取。導向的問題在什麼地方呢?大家都知道大學的第一功能是人才培養,是看人才培養的質量和人才培養對社會的貢獻。一代又一代的人才是大學對社會最重要的貢獻。但是在這四個排行榜當中,人才培養所占的比重最少的隻有5%,也就是說隻有5%到20%的權重在人才培養,80%以上跟人才培養沒有關係。

  第二個學校和學校不可比,大的和小的,文科和理科的,綜合的和單科的這些學校之間都是不能比的。把不同性質的學校拿出來一起比,就像比較大人和孩子一樣,男人和女人一樣,年輕人和老人一樣,他們本身就不可比。

  第三個,標準不一致。這些排行內部的標準是不一致的,不同的排行有不同的標準。

  第四個,指標和標準不匹配。一個指標要有相應的標準匹配它,如果匹配的比較完善還能說明問題,但是我們發現很多指標和標準之間很疏離,甚至沒有什麼太大關係。

  再一個就是數據不可靠,嚴重失實。有主觀原因和客觀原因,主觀上來說,它們的數據搜索要求和標準之間不準確,沒有聯係,或者說聯係不緊密。它知道需要更好的數據,但是這些數據機構涉及不到,或者學校不願意提供給它,因此隻能求其次,用聯係不太緊密的數據替代。

  還有一種可能性是它有數據,但是人家給它的數據是不可靠的,原因也不是人為的。我曾經做過科研管理工作,現在我還參加這方麵的工作。我們經常會通過專家評審的辦法來請大家評審項目,評審獎項,或者評審其他的計劃。

  一開始設計的時候,人員和評價對象還是比較接近的,我想選100個人,我發出100張邀請函,其中50張沒有回信,20張拒絕了,還有10張由於各種各樣的原因沒有給我很好的結果。那怎麼辦?換人。

  我第二次發出90個邀請,結果又經過一次淘汰,等到最後開庭的時候還少20個,所以完全跟它當初的設計沒有什麼關係,這是主觀和客觀造成的,機構沒辦法對全世界的大學進行評價,這是不可能實現的。

  我曾收到幾個排行榜組織的邀請,讓我對大學進行排名。我一開始挺熱情的,但是排到一半不行了,這300個大學我聽都沒聽說,讓我怎麼排名?

  此外,排名的方法也不科學,包括數據采集、分析過程也不是很科學。

  由於曆史的原因,地域的原因,文化的原因,大學排名當中有些嚴重的偏見,我們往往不自覺,甚至漏掉了偏見對排名的影響。

  有些偏見是自覺的,有些評價者自己也不知道。比如說語言偏見,比如需要每個學科邀請30個以上的專家,結果全是英語係的,其他語係的就沒有辦法參加了。刊物的偏見,我們現在有SCI、SCCI,那論文都是一樣的嗎?都是很好的嗎?

  曾經前不久發生過一次讓我非常震驚的事件,有一個沒有上過大學的人,一年寫了800篇SCCI和SCI的論文,涉及到13學科。他把論文進行整合整理,用最新的詞彙,用各個雜誌喜歡的樣式,一年發了800篇論文,我覺得這也是一個奇才。寫論文的學者都被戲弄的無地自容。

  然後我們要特別強調大學排名的風險,我們把它歸納為助長非理性辦學。

  最後提出建議,辦大學要安靜的,長期的,精心辦,不能靠轟轟烈烈,也不是靠一時的炒作就能把一個大學辦好,一定要尊重大學的辦學規律,營造大學良好的辦學氛圍,我們要特別警惕大學的排名給我們帶來的風險。

  我們說大學排名的風險是什麼呢?我想三句話概括。

  第一個不嚴肅;第二個不科學;第三個不可信。

  為什麼我們說它不嚴肅?現在最有影響的U.S.News,從上個世紀80年代開始排名,它們一開始是作為一場遊戲,這個雜誌辦不下去了,怎麼辦呢?主編開會討論,討論完了以後出了一個主意,我們搞個大學排行榜,這個可以吸引眼球,可以提高銷量,大家覺得這個可以做就做了。這個比較簡單就請一些人說你們覺得哪個好,然後引起了軒然大波。

  美國大學能饒的了它嗎?都批評它,它覺得這套路走對了,就開始走下去,開始了U.S.News的排名,當時隻做國內的,後來才做全世界的。其他的單位覺得這個好玩,是很大的商機,紛紛跟進做起了排行榜。

  這是一個不嚴肅的事,覺得排行榜老是把哈佛排在第一不好玩,就排到第三去了。這本身是遊戲,人家是遊戲,你把它當真了。

  但是我們還在做一些傻事,既然影響這麼大,它做遊戲,我不能做遊戲,我得認真對待這場遊戲,所以我們分析一下它科學不科學?我們看這件事情科學不科學,我們要問一係列問題。

  第一個,大學的水平可不可評?如果本來是不可評的,或者現在的方法、技術、數據還達不到可評的時候我們怎麼評價?大學的基本功能是什麼?大學的發明創新和價值怎麼體現?大學對世界的引領作用,文化積澱,大學育人、培養人才,這些內容才是大學的根本使命,這些使命可不可以測量?可不可以用數量化的方法公布?

  至少從目前的四個主要排行榜當中對於這些大學的最根本的文化使命和價值都沒有反映,是它不願意反映,是它認為這個不重要,還是它確實沒辦法?我是出於善良的考慮,我覺得它們沒有辦法,而不是他們認為這件事不重要。

  第二個,該不該評?有些東西該不該作為指標?能不能把它作為評價大學水平高低、質量高低的標準?畢業生工資收入在很多排行榜中成為了重要指標,也是很多大學作為招生的重要內容。但是從整個世界,一個國家來看,這樣的評價就很成問題。

  我們兩彈一星的工程師在奮鬥,我們鼓勵人們到偏遠的山村支教,這是我們大學該鼓勵的還是該反對的?他們的工資不高,他們的人均收入不高,從這個角度他們應該排在後麵,但是我們以這樣的人為榮,這才是社會的價值。有些指標是可以采集的,但是能不能拿來作為我們辦學的方向?

  第三個,重不重要?可以評價大學的東西太多了,你把什麼作為重要的,什麼作為不重要的?也就是指標的確定和指標權重的確定。我剛才已經說了,大學最值得重視的人才培養在評價標準裏麵居然最多隻有四分之一的比重。這樣評出的結果到底還重不重要呢?

  第四個,合理不合理?這個指標放上去了,合適不合理呢?全世界得諾貝爾獎的一共不到495人,但是哈佛大學就有158名。這說明什麼問題?我們往往把這個看的很重,一票定乾坤。

  我們評價學生的時候也是以極數學生做代表,你選出十名或者十五名最能代表學生水平的,結果我們跟這個單位溝通說這個名單沒有給我們,那個公司說這不是你們的,是我們培養的。跟家長說,家長說這主要是家庭教育的成果。當然家長有功勞,企業和社會都有功勞,所以記入你學校的成果也不可信。

  第五,準確不準確。因為數據太多了,就不展開了,有很多數據是誤差的,有很多重複的,也有很多難以評判。

  QS有40%的權重是主觀評價,主觀評價是最不負責任,最不科學的指標。你想即便一個教師再負責任,麵對300個學校做排名,怎麼做出來?一邊喝咖啡,你說這個放第幾位?第8位,放第5吧,第5太前了,那第10吧。

  第六,這樣排係統不係統?用四個字形容,盲人摸象。我們有不同的角度,有不同的數據,也有不同的看法,所以每個人就看到自己的方麵,我們知道部分,部分不等於整體,整體不是部分之和。

  所以根據那麼細的指標,而且這些指標是不充分,不準確,不科學的,要得出一個整體性的排名,這個是荒謬的。我們在選擇學校的時候也經常發生這樣的事情。

  因此它是一個不嚴肅的事情,也是不可信的事情。因此我想用八個字對應,就是姑妄言之,姑妄聽之。他說他的,我們聽我們。如果你太關注這個東西,必然會急功近利。

  我們有些大學非常的智慧找到了躋身排名的捷徑,用什麼辦法?挖人,花錢引進了很多學者,排名從1600多名一下子提高到270名。

  第一,助長大學急功近利的風氣。我們現在非常重視論文的發表,論文在所有的指標當中都是特別重要的指標。本來寫論文是科學發現和科學研究很重要的成果和載體,我們發布的是什麼呢?是我們科學研究的成果,是我們研究的結果,是我們對社會的貢獻。

  但是當論文本身成為衡量指標的時候,我關注的不是怎麼研究發現真理了,我主要關心怎麼讓論文發出來。所以怎麼讓論文發出來和怎麼做出科學的發現,這完全是兩個不同的道路。

  第二個,助長忽視學生和教學的傾向。因為沒有權重,權重很低,當然和我們學校的最重要的工作沒辦法進行匹配了。

  第三個,助長大學忽視自身特色。要想包打天下,這個是不可能的,也不符合社會的需要。社會需要是百花齊放,各盡其能,這個社會才是和諧多樣的。這個指標裏麵對於大學的特色是不強調的,你把精力集中在這些發展上,對特色大學很不利。

  第四個,助長盲目擴張。由於體量大,導致很多大學重組、巴黎、法國、英國都在做這樣的事情。

  第五個,助長不道德競爭。可以想像得到,由於它離開了對真理本身的追求,形成了對功利目標的追求,就會產生很多不道德的問題。

  第六,這是西方文化中心的係統,對西方的雜誌,西方的學者,西方的項目,西方的指標,西方的評價受到吹捧和歡迎。

  最後,我想簡單的提示一下我們的觀點,我們的意見。

  第一個,要建立正確的評價觀和標準體係。非常嚴肅的學術研究需要長期的大量積累和實踐,需要跟蹤研究,而且一定是分類指導。我們不要想有包打天下的評價體係出來,至少我認為我們的智慧和現有的工具做不到。

  如果是比較嚴肅的發布者,我們建議它們重視公共立場與公信力,要有統一的標準、評判同質對象,采納更科學合理的指標體係,配套發布使用說明。在大多數情況下要有一個提示,像吸煙危害健康一樣告訴別人。

  多維視角,全麵解讀。認識需求,合理使用。我們像選學校一樣,我們兩個人考試,我得了200分,你也得了200分,你數學50分,我語文150分,我們兩個一樣嗎?完全不一樣。家長選擇學校的時候一定要搞明白內在含義。

  高校要放下焦慮,可以參考,但是千萬不能作為指揮棒,不能作為努力的目標。現在太多的學校在規劃上寫著要把學校從第幾名提到第幾名,要進前兩百,這怎麼得了呢?這不是辦大學了,這是非常危險的。

  作為政府來說,可以參考,但最好是不見、不看。如果一定要看的話,也不要太在乎。姑妄言之,姑妄聽之。

  最後,我想呼籲大家以正確的態度對待大學排行榜,還大學安寧的環境。

 

  作者:袁振國中國教育三十人論壇成員、華東師範大學終身教授、中國教育學會副會長、《華東師範大學學報(教育科學版)》編委會主任。

  本文為袁振國在《中國教育三十人論壇第五屆年會暨“重構教育評價體係高峰論壇”》上的演講。

免責聲明:

① 凡本站注明“稿件來源:beplay2网页登录”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式複製發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:beplay2网页登录”,違者本站將依法追究責任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出於非商業性的教育和科研之目的,並不意味著讚同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯係。

相關新聞
beplay2网页登录 2021-10-28 17:37