Zi 字媒體

【Manning主講】斯坦福CS224n深度學習與NLP課程全部視頻、PPT

2021/12/25

1 新智元編譯

編輯：劉小芹

【新智元導讀】斯坦福大學CS224n（全稱：深度學習與自然語言處理）是自然語言處理領域很受歡迎的課程，由 Chris Manning 和 Richard Socher 主講。本課程所有教學視頻和課程材料同樣在網上開放可得，新智元帶來每課內容簡介。

全部課程視頻（英文字幕）：

所有課程資料、PPT等：

課程描述

講師和助教團隊

自然語言處理（NLP）是信息時代最重要的技術之一，理解複雜的人類話語也是人工智慧的重要任務。NLP的應用無處不在，因為人們的日常生活大部分都需要語言交流，例如網頁搜索、廣告、電子郵件、客戶服務、語言翻譯，電台廣播等。為NLP的應用賦能的有大量廣泛的底層任務和機器學習模型。最近，深度學習的方法在許多NLP任務中獲得了非常好的性能。這些模型通常可以通過單個端到端的模型進行訓練，並且不需要傳統的任務特定的特徵工程。

在今年春季的NLP課程中，我們將學習實現，訓練，調試，可視化和創建自己的神經網路模型。這門課程為深入學習NLP應用的前沿研究提供了深入的探索。課程最後的項目將涉及訓練複雜的循環神經網路並將其應用於大型NLP問題。在模型方面，我們將涵蓋詞向量表示，基於窗口的神經網路，循環神經網路，長短期記憶模型，遞歸神經網路，卷積神經網路以及一些涉及 memory component 的非常新的模型。通過講座和編程任務，學生將學會令神經網路在實際問題上工作的必要工程技巧。

先修要求

熟悉 Python 編程語言
大學微積分，線性代數（例如MATH 19或41，MATH 51）
基本概率和統計知識（例如 CS109 或其他統計課程）
CS229（機器學習）的同等知識

推薦掌握

自然語言處理的相關知識（CS224N 或 CS224U）
凸優化
卷積神經網路知識（CS231n）

內容簡介

第1講：自然語言處理與深度學習

第1講介紹了自然語言處理（NLP）的概念和當前的NLP研究面臨的問題，然後介紹將詞表示為數字向量的概念，以及設計詞向量的流行方法。

關鍵詞：自然語言處理、詞向量、奇異值分解、skip-gram模型、連續詞袋模型（Continuous Bag-Of-Words，CBOW）、負採樣、 Hierarchical Softmax、Word2Vec

第2講：詞向量表示：word2vec

第2講繼續討論詞向量的概念，以及流行的設計詞向量的方法。

第3講 | GloVe：用於辭彙表示的全局向量

第3講介紹了用於訓練詞向量的 GloVe 模型。本講接著通過觀察如何評估詞向量（又稱詞嵌入）來拓展對它的理解。作為評估技術的一種，接著我們討論了詞的類比問題（word analogies），以及如何利用類比來調整詞嵌入。然後我們討論了訓練模型的權重/參數，以及外部任務的詞向量。最後，我們鼓勵用人工神經網路作為自然語言處理任務的一類模型。

關鍵詞：GloVe、內部和外部評估、超參數對類比評估任務的影響、人類判斷與詞向量距離的相關性、使用上下文處理歧義、窗口分類

第4講：詞窗口分類和神經網路