birdきょうのつぶやき@digitune

きょうのつぶやき@digitune

テッキーな話題。これまで自分で取った写真やビデオは、1)まずwindowsマシンで取り込む、2)cygwinのrsyncを使い日本語ファイル名のために-iconv MS932:UTF-8オプション付きLinuxマシンにバックアップ、というような手順で分散保存してきました。(続く) (13:35 webから)

今回Macに乗り換えるにあたり、1)Windowsマシンから外部USB HDD(FAT32)にコピー、2)外部HDDからMacにコピーバック、という手順ですべてのデータを移行させました。とりあえず日本語ファイル名は正しく読める状態です。(続く) (13:37 webから)

ところが、Mac→Linuxで改めてrsync(今度は双方UTF-8環境なはずなのでiconvオプションなし)をかけてみたところ、全ファイル再転送になったのは良いとして(おそらくFATを経由したことでtimestampが壊れたのではないかと)、一部ファイルに重複が発生しました。 (13:39 webから)

重複とは、ls等で見るとまったく同じファイル名に見えるのに、OSレベルでは別のファイル名とみなされ別々にコピーされてしまった、ということです。どうもひらがなカタカナの濁点・半濁点を含むファイル名を持つファイルがそのような状態となった模様。 (13:40 webから)

今はまだここまでしか調べていませんが、おそらく濁点・半濁点のencodingが複数あって、これまでの方法と今回移行にあたって用いた方法の間で違いがあり、別々のファイル名が生成されてしまったのでしょう。相変わらず文字コード周りは奥が深いです…。 (13:42 webから)

たぶん、Unicodeの合成文字の問題みたいですね。 (13:44 webから)

うおー直帰&麦酒飲みてー!!…が、帰る。 (18:24 twiccaから)

もうすぐ発表らしいE-PM1という手も。 QT @endowt: P300かXZ-1か、なやましい (22:16 twiccaから)