自訂詞典

 「自訂詞典」範例內容與操作方式:


📝 自訂詞典檔案內容(mydict.txt

將以下內容儲存為純文字檔,檔名設為 mydict.txt

王陽明 100000 nr
自然語言處理 100000 n
茶席設計 80000 n
存在主義 50000 n
在場之光 70000 nz
減法哲學 60000 n
知行合一 90000 l
心外無物 85000 l
拉筋班 40000 n
萬里長城步道 30000 ns

格式:
詞語 + 詞頻(整數) + 詞性代碼
詞性代碼如:nr(人名)、n(名詞)、ns(地名)、nz(其他專有名詞)、l(習語)


🧪 使用範例程式碼(搭配 jieba)

import jieba

# 載入自訂詞典
jieba.load_userdict("mydict.txt")

# 測試文本
text = "王陽明提倡知行合一,強調心外無物。他對存在主義的看法也影響了我設計茶席設計的方式。"

# 分詞
words = jieba.cut(text)
print(" / ".join(words))

📌 執行結果預期

王陽明 / 提倡 / 知行合一 / , / 強調 / 心外無物 / 。 / 他 / 對 / 存在主義 / 的 / 看法 / 也 / 影響 / 了 / 我 / 設計 / 茶席設計 / 的 / 方式 / 。

✅ 可見:「知行合一」「心外無物」「存在主義」「茶席設計」等詞都正確被識別為整體詞語,而不是被錯誤地拆開。