search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

用數據全方位解讀《歡樂頌2》

0 楔子

5月11日,讓眾多安迪粉期待已久的《歡樂頌》第二季終於播出。相比首季,《歡樂頌2》在造型和場景上顯得更為精緻時尚,且其中每個角色的造型卻都是遵從的其身份和背景,並不突兀。

正所謂「外行看熱鬧,內行看門道」,作為數據分析愛好者的筆者,自然想從數據的角度去解讀這部熱播劇的方方面面,包括輿情傳播、網路口碑、人物社交網路分析及,以及小說內容的文本分析。以下是筆者在這篇文章想要著重分析的內容:

  • 這部分在互聯網上的輿情傳播如何?包括該劇的全網傳播趨勢、關注人群畫像,及網路營銷手法。

  • 和大獲成功的第一部相比,第二部的口碑如何?主要涉及本劇豆瓣影評的文本分析。

  • 對第一、二季的小說文本分析。主要涉及關鍵詞提取、主要人物的社交網路關係及關聯詞分析等。

在筆者進行分析的過程中,會用到一些常用的(大)數據分析工具,以及環環相扣的數據分析討論,雖然對於常規的數據運營並無直接的幫助,但「他山之石,可以攻玉」,分析的思路卻可以作為參考,以期應用到其他實際的場景中。

1 《歡樂頌2》的大數據輿情分析

在第一部分中,筆者選取了2017.05.07~2017.05.29期間關於《歡樂頌2》的全網輿情數據作為數據分析對象,利用新浪微輿情的「信息監測」和「全網事件分析」作為數據採集、數據分析和可視化的工具。

以下分別從《歡樂頌2》的全網傳播概況及傳播趨勢兩方面進行分析。

1.1《歡樂頌2》的全網傳播概況

(1)全網傳播走勢

上圖是《歡樂頌2》在這段時間內信息傳播走勢圖,自開播之日起,該劇的全網聲量出現了明顯的提升,而且裡面出現了幾個信息傳播的「波峰」,說明當日全網關於該劇的討論(包括媒體和網民個體)較多。尤其需要注意的是,本劇開播當日(5-11)的波峰峰值是該時間段內最大的一個,這是不是一個巧合呢?不要急,筆者會在後面為各位小夥伴解開謎底。

(2)全網正負面信息佔比

從上圖中可以看到,這段時間內,全網關於《歡樂頌2》的信息量有5,564,016條,其中負面信息的佔比達到152,315條,佔到總信息量的2.74%。

同時,在總體上,負面信息隨著時間的推移又不斷增長的趨勢。

結合二者來看,如此這般的負面信息佔比和發展情形對於該劇來說不太有利,說明全網關於該劇的負面口碑評價比較顯著,需要引起製片方的重視,筆者會在接下來的分析中,探明到底出現了哪些負面口碑,以及它們出現的原因。

(3)全網關注度來源

因為在影視劇的傳播聲量中,微博這塊佔據較大的比重,所以筆者在排除微博這一信息來源后,對餘下的信息來源TOP10進行了統計,如下圖所示:

從上圖可以看出,除開微博外,微信、今日頭條這兩大社會化媒體平台上關於本劇的信息量貢獻最多,尤其微信在近日推出了「微信實驗室」,通過新增加的「搜一搜」和「看一看」這兩個入口,使用戶能夠主動搜索關鍵詞,能夠瀏覽熱點資訊、好友關注的資訊以及自己感興趣的文章,這樣的動作加上數年的優質內容沉澱,使得微信在社會化媒體內容生產方面的重要性日漸突出。

(4)全網信息地域分佈

有點意外,全網關注度(關於這部劇的全網信息量)排名榜首的是江蘇,竟然不是北京和上海這兩大年輕白領雲集的現代化的都市,尤其是上海,關於本劇的信息量分佈在TOP10中墊底,難道上海的網民和媒體絕大部分都棄劇了?或者說是本劇的口碑極差?

對於此種疑問,筆者將會在第二部分進行分析。

1.2人群畫像

因為關於本劇的探討,微博(主要是新浪微博)佔據大頭,所以筆者選取該平台上的人群作為分析對象。

(1) 性別分佈

毫無疑問,女生是該劇的忠實擁簇,他們對該劇的狂熱絕對超過男生。

(2) 年齡分佈

從下圖中可以看出,19-34這個年齡區間佔據關注人群的70%左右,也就是說青年群體對該劇很感興趣。

(3) 興趣圖譜

下圖給出了關注該劇的人群的興趣標籤TOP5,可以看出,這部分人群比較追星,熱愛生活,都是一些極具年輕人特質的興趣愛好。

由此可見,關注《歡樂頌2》的主體是一群熱愛生活、熱衷於明星的青年女性。

1.3 《歡樂頌2》開播當日的營銷宣傳分析

在前面提及的全網傳播趨勢中,筆者提到了該劇在開播當日就出現明顯的聲量高峰,很明顯,這絕非偶依然。

從前面的信息來源分佈可以得知,該劇絕大部分的聲量都來源於微博,尤其是新浪微博。為此,筆者單獨調出5-11的微博信息趨勢數據。

從上圖可以看到,新浪微博上關於該劇的信息量大體上是呈現上升趨勢的。在當日的23時左右達到高峰,而且這種增長趨勢很有節奏感---從工作時間段9:00開始,聲量隨時間的推移不斷上漲。

為了進一步發現其中的傳播規律,筆者利用新浪微輿情的「信息監測」模塊對其中有影響力的微博進行了進一步的搜尋和排查,也就是發現其中轉發次數較多的微博,以及順藤摸瓜,發現傳播源頭。

經過逐步的抽絲剝繭,筆者發現了其中轉發量較多的幾條微博,也就是傳播源頭,主要是《歡樂頌2》的幾位主演的微博賬號和一些跟該劇有關的微博話題。從實際效果來看,《歡樂頌2》的幾位主演---劉濤、王凱、楊紫等人在新浪微博上的影響力較高,冬粉數量龐大,主動轉發積極,使得對劇集宣傳的效果也相對較好。

除了主創人員的主動推廣外,《歡樂頌2》的推廣營銷方式也是豐富多樣。在微博推廣上,《歡樂頌2》的宣傳物料準備充足,預告片、小花絮、主題曲MV等一應俱全;宣傳矩陣搭建完整,不僅注意與微博官方賬號「新浪娛樂」、「新浪電視」、「東方衛視番茄台」和」@微博電視劇「等)、廣告品牌等多方聯動,而且KOL輿論引導投入巨大,還邀請其他明星助力宣傳(如范冰冰)。

然而,從上面的傳播效果來看,媒體大號的傳播效果沒有明星個人的微博賬號傳播效力大,那麼,其中的原因又是什麼呢?我們接著往下看。

1.4 微博傳播效果分析

為了深入了解媒體大號和明星個人微博傳播特點和規律,筆者特地找了5-11當天冬粉互動量較大的2條微博---分別為@微博電視劇和劉濤的個人微博賬號@劉濤tamia,它們的轉發評論幾近一致,方便在同等條件下發現其中的傳播規律。

將這兩條微博的轉發傳播關係數據導出,製成能夠清晰反映傳播路徑的可視化「力導向傳播圖「:

上圖是@微博電視劇關於《歡樂頌2》的營銷微博的傳播路徑圖,其中紫色「簇群「的中心就是賬號@微博電視劇,除了它自己帶來的轉發傳播(也就是紫色簇群區域內的小圓點)之外,周圍還有一些次級傳播中心,比如「十三點半的kings」、「影視大米FAN」、「吳侃侃kkw」這樣營銷性質很強的自媒體賬號進行協助宣傳,顯然這是宣傳方砸錢買的流量,不是自帶的。

而下面劉濤的該條微博就呈現出明顯的「中心化」特點,也就是除了劉濤個人微博賬號以外,就沒有特別明顯的次級傳播中心,絕大部分的傳播都來自於劉濤的賬號冬粉。

由此,結論不言自明:

明星個人微博的傳播叫媒體大號而言更有效力,因為明星因其個人魅力,吸聚的冬粉多,發的微博貼近生活,跟冬粉之間有較強的互動關係,而且他們的冬粉團體也會不遺餘力的去散播此類消息,所以傳播效力更強一些。相比之下,微博大號因為自身的營銷屬性,除非有利益驅動,冬粉才會主動參與互動,一般而言不會太強,更有甚者,會發動水軍進行操作,通過不正當的手段以謀取利益。

好了,上面是關於《歡樂頌2》的大數據輿情傳播分析,下面會進入到另一個板塊---對該劇的口碑(主要是豆瓣影評)和小說文本進行文本挖掘,期待發現一些更有趣的內容。

2 《歡樂頌2》的豆瓣口碑分析和小說文本分析

一般來說,對於文本的深入挖掘往往能實現「知其然並知其所以然」的效力,因為文本不像數字那般空洞和抽象,內容往往能直接揭示出原因。

這部分的數據主要有:

  • 《歡樂頌》第一季和第二季的豆瓣影評

  • 《歡樂頌》第一季和第二季對應的原著小說,《歡樂頌2》的劇集將把后兩季的小說內容進行打包拍攝,所以第二、第三季的小說內容都會出現在《歡樂頌2》的劇情里

豆瓣電影是最大與最權威的電影分享與評論社區,收錄了百萬條影片和影人的資料,有2500多家電影院加盟,更匯聚了數千萬熱愛電影的人,因而這裡關於影視劇的評論具有一定的代表性和公信力,可以在很大程度上反映一部影視劇作品的口碑狀況。所以,筆者抓取豆瓣上《歡樂頌》一二季的影評作為口碑分析的依據。

2.1《歡樂頌》一、二季的總體口碑對比分析

(1)評價星級

從總評分來看,《歡樂頌》第二季要明顯遜色於第一季,前者拿到了7.3的高分,而後者僅獲得了5.2的評分。

從第一季和第二季的評價星級佔比可以看出,出現第二季總評分低於第一季的原因在於:第二季在中高分區間「4星」和「3星」中的佔比要小於第一季,而在低分區間「2星」和「1星」中的比重要高於第一季。

(2)《歡樂頌2》的豆瓣影評情感傾向分析

由於第一季的口碑要好於第二季,所以筆者接下來著重分析一下第二季的豆瓣影評的「情感傾向」。

這裡的「情感傾向」是以一個介於0~1之間的「情感極性值」來表徵---如果某條評論的情感極性值越接近於0,說明它的負面情感傾向越明顯,越接近於1,說明它的正面情感傾向越明顯,而取值在0.5左右徘徊,這說明這種情感傾向不明顯,是為「中性」。筆者將情感傾向值的取值區間0~1細分為3個子區間,分別對應不同的情感傾向:

豆瓣影評具有獨特的語言風格---反諷,貶義褒用,不像商品評論那般直白外露,它的語義往往含蓄且幽默。所以在分析之前,筆者找到大量有標註的豆瓣影評語料,利用機器學習進行情感語義模型訓練,以期達到良好的情感正負面判斷效果。初步結果如下:

經情感傾向標籤映射處理,得到如下結果:

從上圖可以看到,第一季和第二季的情感傾向的最大差異在於正負面情感的比重不同:第一季的評論正負面情感佔比旗鼓相當,而第二季的負面情感明顯佔據主導地位,正面佔比大幅壓縮,這也是本劇豆瓣評分不高的原因之一。

再看一下情感傾向隨時間發展的走勢情況,筆者選取的分析時間段是3.31~5.22,也就是該劇播出前一個多月和播出后一段時間的情感傾向走勢。這裡採用的是情感傾向值累加的數值,越高說明口碑評價越好,這也兼顧了評論數量上的增減情況(豆油願意參與評分,哪怕是負面評分,也說明對本劇有一定的關注度)。由此得到下圖:

可以看出,在本劇播出次日,情感傾向值達到高峰,隨後一路下降,結合這段時間內的總體情感傾向佔比可知,豆油們對於該劇播出后的劇集的關注度和口碑評價都呈現出下降的趨勢。

那麼,究竟是什麼原因讓廣大豆油們對該劇如此嫌棄呢?請接著往下看。

(3)《歡樂頌》一、二季豆瓣評論內容的關鍵詞對比分析

以下是關於《歡樂頌》一、二季豆瓣評論文本的關鍵詞對比分析,可以在這張直觀的可視化效果圖上看到「豆油」們對《歡樂頌》一二季方方面面的評價。

上圖中,對於一二季的評論文本分別按照「高提及率(Frequent)」和「低提及率(Infrequent)」進行了劃分。上圖以橫縱軸的「Average」進行切分,則可以分為4個象限,右上角的為2類文本提及率皆高的辭彙,左下角為二者提及率皆低的辭彙。左上和右下僅是二者之一高提及率的辭彙。

另外,藍色點陣代表的辭彙屬於對《歡樂頌》第一季的評價,黃色點陣所代表的的辭彙屬於對《歡樂頌》第二季的評價,右上角的象限二者的評語趨於重合。

在右邊的TOP Terms(重點關鍵辭彙)一欄中可以看到,對於第一季的評論,豆油們主要提到了該劇的cast/卡司( 演員陣容強大)、山影山東影視製作有限公司,該劇的出品方)、(看該劇)停不下來、(人物形象)豐滿,以及關於安迪和奇點(魏渭)的情感主線的探討,但沒有出現明顯的負面評價,甚至以褒讚為主。

而第二季里,很多豆油拿第一季和第二季進行對比,認為本劇和第一季沒得比,還有就是本劇里的插曲太多,好似一個MV大集合(「MV」、「mv」、「歌曲」、「就唱」),正如某位豆油的評論所說「一開始就狂配bgm,而且感覺和劇情並不搭嘎,什麼咖喱歌一股鄉村風」。。。值得玩味的是,也有都有拿本劇和同一時間段的《白鹿原》做對比,兩部劇均包含對時代環境和個體發展的探討,但在格局、視野以及最終呈現方式上都有較大不同。

點擊其中的關鍵詞,看到關於這些關鍵詞的評論詳情(語句經過分詞和去停用詞)。

總之,豆油們關於第二季的吐槽很多。

由此,筆者想進一步看看豆油們到底還有哪些關於該劇的槽點。

(4)第二季的典型意見挖掘對比分析

將經預處理得到的5000條典型評論進行文本聚類,每一個文本聚類「簇群」都會有一個中心語句,也就是該「簇群」的典型意見,所以這種文本處理也叫做「典型意見挖掘」,用來從海量的文本里發掘主要的觀點或意見。

經筆者處理,5000條評論被劃分為300多個成分佔比不一的「話題簇群」,筆者僅選取其中佔比TOP10的典型意見進行展示。

從上表可以看出,豆油們關於本劇的典型意見多為負面,集中在以下幾個方面:

  • 比第一部差,主要詬病的地方在於本劇的劇情、編劇和演員演技,以及硬生生的人物專屬插曲亂入

  • 三觀不正,被吐槽為「高配版小時代」,倡導「紙醉金迷」的富人價值觀

  • 對本劇中的個別角色及其主演的喜好,如邱瑩瑩和趙啟平及其扮演者

除此之外,本劇廣告植入太多也是很多豆油吐槽的地方,本劇為了配合植入廣告,角色人物的吃穿用度多處設定明顯違和,甚至有豆油表示「《歡樂頌1》是在劇情里插播恰到好處的廣告,而《歡樂頌2》是在硬生生的廣告里插播劇情。。。」

(5)「五美」人物點評詞雲

綜合豆油們關於《歡樂頌》第一季和第二季關於劇中「五美」的評論,筆者製作出安迪、曲筱綃、樊勝美、關雎爾和邱瑩瑩的個性化評論關鍵詞詞雲。

不消筆者多說,小夥伴們就能看出這些人物關鍵詞詞雲,主要反映了豆油們對於「五美」的人物印象及其主要的關聯人物。對於這五個人的性格特徵,由上述關鍵詞詞雲可以總結為:

  • 外冷內熱、氣場強大的冰山御姐安迪

  • 古靈精怪、魅力超群的小妖精曲筱綃

  • 虛榮拜金、獨立自強的驕傲女王樊勝美

  • 文靜內斂、一團和氣的優質女孩關雎爾

  • 單純可愛、精力充沛的元氣少女邱瑩瑩

此處,對於小說文本的關鍵詞提取,筆者沒採取一般文本分析時所採用的詞頻統計,而採用的是TF-IDF(term frequency–inverse document frequency)關鍵詞統計方法,從而更有效的提取文本中的關鍵信息。詳情可以參閱《

以為例,來談大數據輿情分析和文本挖掘

》的第三部分。

以下是該《歡樂頌》一二季原著小說的關鍵詞TOP20。

可以看出,一二季小說文本的關鍵詞絕大部分是其中的主要人物,而主要人物的總體順序(對於小說而言是人物的重要性)變動不大,個別人物出現重要性的「位移」:

  • 安迪、曲筱綃和樊勝美是一二季中妥妥的一號、二號和三號女主人公

  • 包奕凡在第二季的重要性有所提升,而魏渭的重要性則呈現下降的趨勢

  • 電視劇第二季中出現的謝濱(也就是電視劇中的音樂達人謝童)、舒展和陳家康也出現在小說二三季的關鍵詞TOP20中,不過排名較為靠後。

這也說明,小說和劇本在人設上保持有連貫性,沒有明顯大的變動。

(2)一、二季劇中人物社交網路分析

通過設置人物詞典,筆者從中提取出《歡樂頌》一二季對應小說文本的人物社交關係圖譜,用來發現2部電視劇中人物關係的特徵。

在人物社交網路中,每個節點代表一個人物,線條代表人物之間的關係,線條顏色的人物節點代表他們之間有著較為頻繁的交往(或友或敵)。節點及其代表人物字體的大小表徵的是「Betweenness Centrality (中介性核心性)」,該詞學術的說法是「兩個非鄰接的成員間的相互作用依賴於網路中的其他成員,特別是位於兩成員之間路徑上的那些成員,他們對這兩個非鄰接成員的相互作用具有某種控制和制約作用「,說人話就是—字體大的人物具有更大的人際關係影響,能接觸和影響的人物較多,而在小說中出現次數多的未必就是這類人物,這裡的存在感需要以人脈和影響作為基石。詳情可參看

》的第三部分。

從上圖可以看出,第一季中的安迪和幾個主要人物都有很強的人際聯繫,他們之間的連線較粗,而譚宗明、曲筱綃、樊勝美等人的人脈資源豐富,或者是他們人際交往/應酬較多。

在第二季的人物社交網路中,則呈現出「去中心化」的趨勢,除了成為愛人的包奕凡外,第一主角安迪與其他人的交往沒之前那麼密切了。按照劇情發展,他們之間迎來了情感的新可能,卻也面臨來自身世及包家內部帶來的新困擾,加之後媽魏太太的不斷責難,這樣也不久難理解安迪和其他人的交往較第一季要少了,自身麻煩不斷,所以無暇顧及。。。

當然,第二季的人物情感脈絡也很清晰了,即使有攪局者的出現(魏渭、舒展、陳家康等),固定的CP組合也沒有出現變化,如安迪-包奕凡、邱瑩瑩-應勤,曲筱綃-趙啟平,樊勝美-王柏川,以及關雎爾-謝濱(謝童)。

(3)小說文本的人物關聯詞分析

在最後,筆者把《歡樂頌》小說1、2、3季合併,經過文本預處理后,再進行小說文本的詞向量訓練,將這些辭彙映射到向量空間,變成一個個詞向量(Word Vector),以使這些辭彙在便於被計算機識別和分析的同時,還具有語義上的相關性,而不僅僅是基於辭彙之間的共現關係。

由於篇幅原因,筆者僅涉及跟「五美」相關的關聯詞分析,各呈現TOP10的關聯詞,由此發現跟主設人物相關的辭彙,發掘人物深層次的特點。

從上面「五美」的TOP10關聯詞可以得到兩類關聯詞:

第一類詞是跟主設關係密切的人物,如魏渭、包奕凡之於安迪,趙啟平、劉歆華之於曲筱綃等,這些都符合大家對於電視劇的認知。

另一類是反映人物行為的辭彙。如安迪和曲筱綃,二人常用的通信工具都有電話,其他三人只用手機進行通訊。而電話一般指固定電話,設在辦公室,較為正式,領導或是管理層用的比較多;而手機具有便攜性,無論室內和外出都用的多。

安迪、曲筱綃和樊勝美的關聯詞里有涉及「昨晚」,再對照小說原本,三人都有很多晚上交際應酬的場景。

此外,在樊勝美、關雎爾和邱瑩瑩的關聯詞里,都出現了「連忙」一詞,有「立即」、「馬上」的意思,也就是經常會出現倉促、手忙腳亂的情形。

字字珠璣間,折射出「五美」所處的社會階層和自身心態。

結語

雖然分析下來,《歡樂頌2》在劇情和各種細節上多有瑕疵,加之違和感很強的硬廣植入,所以它的口碑遠不及第一季。然而,《歡樂頌2》還是較好的繼承了第一季典型的人物設定,很多觀眾能夠通過「五美」看到自己或者身邊人的影子,雖是小說,但也緊密觀照當下現實,擁有一種天然的熟悉感和代入感,更能引發劇集和觀眾之間的情感共鳴,甚至還被許多都市白領奉為生存指南和戀愛擇偶教科書。

或許,像很多毀譽參半的影視劇那樣,關於它們的評判本來就是模稜兩可的:

譽滿天下,未必不為爛片;謗滿天下,未必不為佳劇~

那麼,看完本文或本劇的小夥伴,你覺得呢?

ps:筆者寫完這篇文章的時候,第二季還一集沒看哦,有對劇情誤讀的地方還請資深劇迷見諒哦,哈哈哈。

參考資料及工具:

1.新浪微輿情:「全網事件分析」、「信息監測」及「微博傳播效果分析」模塊(數據採集、數據分析和數據可視化呈現)

2.微指數(人物畫像)

3.《歡樂頌》1、2、3季的小說原著(文本數據)

4.《歡樂頌1》和《歡樂頌2》的豆瓣影評(評分數據和文本數據)

5.Python,jieba分詞、snownlp、gensim、tagul(部分文本處理和分析)

限時乾貨下載:添加微信公眾號「數據玩家「fbigdata」」

回復【2】免費獲取「完整數據分析資料,包括SPSS\SAS\SQL\EXCEL\Project!」



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦