Logo

LOPEN 計劃是台大語言學研究所語言處理與人文計算實驗室 (簡稱 LOPE) 所推動的一項中文語言與知識資源開放的計劃。我們相信,資源的開放可以促進經驗研究的重製,研究的創新與社會的進步。

[繁體中文] [English]

Follow @lopentu

資源及工具

Deep Lexicon (DeepLEX)

以中文為核心的巨量開放詞庫,放棄原子論式的詞彙觀點,讓我們把它開發成為詞彙相關研究的基礎建設。

[連結]

Chinese Wordnet (CWN)

中文詞彙網路著眼於建構一個深層的語義與概念網路。精細的詞意分析與開放的關係設計將有助於理解語言與心智的構作

[連結] [CWN v1] [CWN v2]

Chinese Word Map (CWM)

中文詞彙地圖是一個以華語文教學爲目的的詞彙知識素描混搭系統。也是字典學的破壞性創新提案。

[連結]

Corpora Open and Search (COPENS)

開放語料庫與搜尋工具。自動預處理與自由標記。讓我們期待一個內容共享,工具共創,製程開放的新一代語料庫語言學。

[連結]

PTT Corpus

作為一個台灣特有的 BBS 系統,PTT 記錄了珍貴而有趣的社會語言文化現象。提供了語言接觸與演化,與「精簡語言學」重要的經驗訊息。

[連結]

Chinese variation

台灣國語和大陸國語的平行語料庫。

[連結]

Lopotator

Lopen 標記系統

[連結]

Toxic Talk

由網路評論訓練出產生惡言的工具。

[連結]

學習共筆

協作閣

LOPE實驗室成員的學習筆記部落格。

[連結]

開放課程

人文學群的 Python 程式入門 (2018)

[連結] [GitHub]

語料庫語言學 (2018)

[連結]

語料庫程式實務工作坊 (2018)

[活動頁面] [GitHub]