你們的豆瓣電影評分數據，暴露了國產爛片哪些真相？

2021/12/25

作者/數據俠 Souseki 來源：DT財經

2016年電影市場繼續保持火熱，影片數量和票房都再創新高，越來越多的資源融入到這個欣欣向榮的行業。與此同時，我們還是常常被爛片刷屏，佳作一片難求。數據俠Souseki爬取了豆瓣電影上的數據並進行分析，結論是：國產電影的質量一直在下滑，一些演員更是在爛片的坑裡越陷越深。

為了看看國產電影的整體表現，我抓取了2000年到2016年的豆瓣電影條目里有「」標籤的全部數據，之後對數據進行了清洗：比如剔除信息缺失嚴重的樣本，篩掉綜藝節目、脫口秀、晚會、演唱會等類型。

由於時間等客觀因素的限制，此次分析的數據樣本不一定覆蓋了所有時段的所有國產影視作品，但是基本囊括了主流作品，具有一定的代表性，算是一個對總體的簡單隨機抽樣吧。

首先根據樣本數據畫了個散點圖，橫軸表示時間，縱軸表示豆瓣評分，散點的大小表示該作品的評論人數，點越大，表明評論人數越多。紅色曲線展示了2000年1月到2016年12月，每個月上映的所有作品平均分的走向。

從這張圖可以明顯看出，2000年到2016年，國產影視作品的平均分走向是曲折的、迂迴的，但總體趨勢是倒退的、下降的。

縱然，以豆瓣的平均分作為每個時段的評價指標有很大的局限性和片面性。

對於觀眾而言，一個月即使爛片扎堆，只要還有一部不錯的作品，人們就不會對這個月的觀影體驗打太低的分。不過，平均分作為一種總體評價指標也有重要的可取之處，至少它會提醒我，這個月真的有很多爛片。

我還製作了一個視頻，展示2000到2016年的192個月里每個月的影視作品得分分佈，以及當月的平均分。

為了增加動態效果，同時也為了減少點和點之間的重疊，我給散點增加了0.2個單位範圍的隨機擾動，所以每一幀圖同一個點的位置可能存在細微差別。這條時間序列曲線可能存在某種固定的周期波動，有興趣的朋友可以再細緻分析下它的長期趨勢和周期變化，這裡先不做展開。

▍限制級題材片水平有待提高

豆瓣上的電影都會有相應的類型標籤，例如劇情、驚悚、戰爭等等。在我抓取到的樣本數據中，共有30個類別。下面這張圖展示了平均得分最高和最低的五個類別。

得分最高的5個類型是戲曲、紀錄片、西部、短片、歷史。

戲曲類影片的平均得分這麼高是很多人想不到的。作為特有的藝術表現形式之一，戲曲類的影片常常表現出較高的藝術性。但由於受眾基礎不大，往往容易被大家忽略。

另一個常出佳片的國產電影類型則是紀錄片。天朝還是有很多優秀的紀錄片和紀錄片導演的，像前不久，范儉執導的《搖搖晃晃的人間》和王久良的《塑料王國》就在阿姆斯特丹紀錄片電影節上獲獎。

（圖片說明：《大明王朝1566》電視劇宣傳照；圖片來源於網路）

另外，歷史題材的電視劇也有不少佳作，《大秦帝國》、《大明王朝1566》、《康熙王朝》、《走向共和》、《大宅門》等在豆瓣上都有很好的口碑。導演用心、劇本紮實、演員有實力，評價自然不會差。

得分最低的5個類型是災難、冒險、恐怖、情色、驚悚。

個人感覺，上世紀八九十年代，大陸有很多恐怖片確實蠻嚇人的，之前網上流傳的89年版的封神榜也是極其瘮人。

與紀錄片、歷史劇這類比較「正」的題材不同，限制級題材的電影天生自帶獵奇屬性。很多觀眾喜愛驚悚、情色、恐怖類的影片，某種程度上，是為了滿足個人的想象空間。

然而，一味追求獵奇而忽略了故事、人性等電影的基本要求，只會不斷出現假、大、空的「偽電影」，被人詬病也就在所難免了。

▍最受關注的演員和導演

我把每位演員參演的所有作品的評價人數進行累加，得到了評價人數之和，也就是計算了所謂的「關注熱度」。

在累加的過程中，每部作品對所有參演演員的權重都是一樣的，也就是說不區分主角和配角。

當然，這種計算方法有值得商榷之處，因為你當時看這部片子時只是沖著你愛豆去的，並不care其他演員，不過，你必須承認的一點是，他們確實與你混了個臉熟。

下圖列出了最受關注的演員前20名，同時列出了其參演的所有影視作品的平均得分。

最受關注的演員前5名是，林雪、黃秋生、陳坤、劉德華、古天樂。林雪這個名字，乍一聽可能陌生，但他那張臉，你應該再熟悉不過了。

就是他。

導演方面，馮小剛、劉偉強、麥兆輝、杜琪峰、張藝謀是最受關注的5位導演。演員林雪正好是杜琪峰執導影片中的常客，導演的作品如此受關注，演員自然也沾光。

在列出的這20位導演中，姜文、王家衛、寧浩的作品平均得分最高。又要看的人多，還要大家都說好，確實不是件容易的事呢。

在樣本數據中，我還將每位演員參演作品的數量和導演執導作品的數量進行了統計，評選出了勞模演員和勞模導演，讓我們看看他們都是誰吧。

（圖片說明：左圖是勞模演員，右圖是勞模導演）

▍到底誰演了爛片?

描述做完了，還想跑個回歸。

線性模型中以豆瓣評分作為因變數，另外再加倆logistic模型，根據豆瓣評分劃定下「及格線」和「爛片」標準。

在我的樣本中，豆瓣評分均分是6.25，那麼就以6.25分作為及格線，得分大於6.25分的作品才算及格。但把得分低於或等於6.25分的作品稱作爛片似乎有點嚴苛，所以我以平均分減去一個標準差的結果（4.29）作為劃定爛片的標準。

根據個人的興趣和喜好，我加入了以下導演、演員和其他控制變數。

在導演和演員變數方面，黃曉明、楊洋、呂中獲得了在三個模型中都顯著的殊榮。不過呂中老師在三個模型中估計係數的符號與另外兩位演員剛好是相反的。

以黃曉明為例，他在OLS模型中的估計係數為-0.557，在0.05的水平上顯著，這表示在其他條件都不改變的情況下，一個影視作品若有黃教主參演，那麼它的豆瓣評分將平均降低0.557分。

楊洋同學同理，不再贅述。

值得一說的是，呂中老師在模型中的估計係數剛好與其他兩位演員相反，這表示，一個影視作品若有呂中老師參演，那麼它的評分將平均提高0.73分，同樣根據剩下兩個模型，我們也可以判斷，呂中老師參演的作品其豆瓣得分更有可能在及格線以上，以及更不可能成為爛片。

所以，在我選取的這些演員中，與爛片顯著相關，以及參演作品得分明顯較低的演員有：黃曉明、楊洋、陳學冬、楊穎、范冰冰等。

而參演作品豆瓣評分明顯較高的演員有：呂中、倪大紅、陳寶國、陳道明等。

當然，這裡我們不能進行粗暴的因果推斷，即認為某某參演的電影或電視劇就有可能成為爛片。

以上分析只是體現了一種相關性，也就是說在既定事實中，某某參演的作品確實評分較低，但這種低評分或許有其他原因導致也未可知。