2014年5月18日 星期日

關於 \xbb 字元的處理

在使用python時,曾遇到 print \xbb 出錯的問題:
UnicodeEncodeError: 'cp950' codec can't encode character '\xbb' in position 0: illegal multibyte sequence
從來查了一下,得到以下資訊:
  1. \xbb 字元就是「»」這個字元。
  2. windows環境中的命令提示字元,是使用cp950字元集,會有以上錯誤。
  3. 在ubuntu環境下的terminal,是使用utf-8字元集,可以正確顯示。
所以怎麼辦呢?
  • 方法一:將'\xbb'替換掉 (字串的replace)。
  • 方法二:在命令提示字元輸入 chcp65001,會切換成utf-8字元集。它會有輸出,不會有Error,但是輸出結果看似亂碼而非「»」。

沒有留言:

張貼留言