「自訂詞典」範例內容與操作方式:
📝 自訂詞典檔案內容(mydict.txt
)
將以下內容儲存為純文字檔,檔名設為 mydict.txt
:
王陽明 100000 nr
自然語言處理 100000 n
茶席設計 80000 n
存在主義 50000 n
在場之光 70000 nz
減法哲學 60000 n
知行合一 90000 l
心外無物 85000 l
拉筋班 40000 n
萬里長城步道 30000 ns
格式:
詞語
+詞頻(整數)
+詞性代碼
詞性代碼如:nr
(人名)、n
(名詞)、ns
(地名)、nz
(其他專有名詞)、l
(習語)
🧪 使用範例程式碼(搭配 jieba)
import jieba
# 載入自訂詞典
jieba.load_userdict("mydict.txt")
# 測試文本
text = "王陽明提倡知行合一,強調心外無物。他對存在主義的看法也影響了我設計茶席設計的方式。"
# 分詞
words = jieba.cut(text)
print(" / ".join(words))
📌 執行結果預期
王陽明 / 提倡 / 知行合一 / , / 強調 / 心外無物 / 。 / 他 / 對 / 存在主義 / 的 / 看法 / 也 / 影響 / 了 / 我 / 設計 / 茶席設計 / 的 / 方式 / 。
✅ 可見:「知行合一」「心外無物」「存在主義」「茶席設計」等詞都正確被識別為整體詞語,而不是被錯誤地拆開。