這篇完整講解了 Python Unicode 的作法, 例如為什麼都已經是 Unicode 了還會有 encode, decode 的需求? 答案是因為電腦內部以二進制儲存 Unicode, 而一般網頁等程式能處理的是經過"文字編碼"後的 text code (utf-8, big5, gbk). 而為什麼常看到 UTF-8? 因為 UTF-8 這套文字編碼相容英文最常用的 ASCII 文字編碼, 所以大多數英文程式不需要改寫就能沿用. 所以從網頁/程式存中文到資料庫(電腦)時要做 data.encode('big5') 的動作來存到電腦中. >>> h = '哈囉' >>> h '\xab\xa2\xc5o' >>> 從電腦中取出的中文 data 要做 data.decode('big5') 的動作, >>> print h 哈囉 >>> h.decode('big5')