タグ別アーカイブ: i18n

[git] diffの文字コード対応

システムと異なる文字コード(たとえばShift-JIS)でエンコードされたファイルのdiffにおける文字化けを解消する

1. 拡張子で文字コード変換を適用するファイルを指定

.gitattributesに属性を記述する

1.1. 属性指定の例

続きを読む

macOSにおけるカタカナファイル名の文字化け

Unicodeは濁音(『が』や『ば』など)や半濁音(『パ』や『ピ』)を1文字として扱っています。一方で濁点『 ゙  』(U+3099) や半濁点『 ゚  』 (U+309A) も定義しています。この結果、Unicodeでは『が』は『か』+ 『 ゙  』の合成文字として表現することもできます。

  • WindowsやLinuxのファイルシステムは濁音や半濁音を1文字として扱う NFC (Normalization Form Canonical Compression) を採用しています。
  • MacOSのファイルシステム(HFS+)は本体文字と濁点・半濁点を分離して扱う NFD (Normalization Form Canonical Decompression) を採用しています。俗にいう uft-8-mac です。
  • subversionやscpなど NFC と NFD の差異を考慮していないツールを使うと、Windowsで保存された『コーディング規約.txt』なんてファイル名が文字化けして、もしくは、コマンドが落ちて、「ぎゃっ!」ということになります。

漢字コード一括変換

出力形式(Output Encoding)

  • -w : UTF-8
  • -w8 : UTF-8
  • -s : Shift_JIS
  • -e : EUC
  • -j : JIS(ISO-2022-JP)

出力改行コード

  • -Lu : UNIX形式(LF)に変換
  • -Lw : Win形式(CRLF)に変換
  • -Lm : 旧Mac形式(CR)に変換

iconvコマンド

変換元文字コード指定

-f ENCODING, --from-code=ENCODING

 

変換先文字コード指定

-t ENCODING, --to-code=ENCODING

 

文字コード

SJIS Shift JIS
CP932 Microsoft拡張 Shift JIS
X0208 JIS
EUCJP EUC

 

サポート文字コードリスト一覧

-l, --list

Android Studio SJIS文字化け解消

Android StudioでShift-JISのソースコードが文字化けするのを解消する

確認バージョン
Android Studio 1.3.2 for MacOS X

Android Studio => Preferences…

Android Studio Encoding Settings

Android Studio を再起動する。


.idea/encodings.xml