在我們的python程式當中,難免會使用到中文字串。我們的程式碼,常見的會是big5(cp950)編碼或是utf-8編碼。我們需要在程式的開始註明檔案的編碼,python才能正確處理中文字串。
註明檔案編碼的方式,是在程式碼「開頭兩行的其中一行」註明,該行格式簡單來說是:
- # 或是 [一些空白字元] # 開頭
- 也就是說,該行只能有註釋,而註釋符號 # 之前可以有一些空白
- 包含字串 「coding: utf-8」 或 「coding: cp950」
- python看到「coding:」之後,會抓取後面的詞當作是編碼
再強調一次,這一行編碼註記必須出現在原始碼的前兩行。
python是用regular expression來處理該行的。所以,如果你要使用 cp950,以下提供一些範例:
- # -*- coding: cp950 -*-
- # encoding: cp950
- # coding: cp950
- # I love coding: cp950 and you?
- # ccccccccccccccccccoding: cp950 0000000000000
不過,如果程式要讓人家容易看懂,還是不要太搞怪比較好。