-
Notifications
You must be signed in to change notification settings - Fork 2
Shift_JIS, EUC-JP, UTF-8, UTF-16LE/BEをUnicodeコードポイントに変換する.
License
odashi/encoding
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
各種文字コードをUnicodeコードポイント(UTF-32)へ変換するためのライブラリです. ---------------------------------------- Encoding::getEncoding(src, src_size) 文字コードを判定します.判定できるコードは以下の通り. UTF-16LE/BE (with/without BOM) UTF-8 (with/without BOM) Shift_JIS/CP932 (JIS X 2013:2004) EUC-JP (JIS X 2013:2004) Encoding::decode(dest, dest_size, src, src_size, encoding) 指定した文字コードのテキストをUnicodeコードポイント配列に変換し, 実際に格納されたコードポイント数を返します. destがnullptrだった場合はdestに必要なサイズのみ計算して返します. Encoding::encode(dest, dest_size, src, src_size, encoding) Unicodeコードポイント配列を指定した文字コードのテキストに変換し, 実際に格納されたバイト数を返します. destがnullptrだった場合はdestに必要なサイズのみ計算して返します. (まだ実装してないです...) ---------------------------------------- JIS X 0213 to Unicode変換テーブル x0213.orgの「JIS X 0213:2004 漢字8ビット符号とUnicodeの対応表」を元に 機械変換を行って作成しています. http://x0213.org/codetable/jisx0213-2004-8bit-std.txt 元のテーブルでUnicode側が2文字シーケンス(「か゜」など)になっているものは U+FFFD(判定不能文字)へ割り当てています. ---------------------------------------- 文字コード判定 Jcode.pmの方法を参考にしています.
About
Shift_JIS, EUC-JP, UTF-8, UTF-16LE/BEをUnicodeコードポイントに変換する.
Resources
License
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published