Skip to content

odashi/encoding

Repository files navigation

各種文字コードをUnicodeコードポイント(UTF-32)へ変換するためのライブラリです.

----------------------------------------
Encoding::getEncoding(src, src_size)
	文字コードを判定します.判定できるコードは以下の通り.
		UTF-16LE/BE (with/without BOM)
		UTF-8 (with/without BOM)
		Shift_JIS/CP932 (JIS X 2013:2004)
		EUC-JP (JIS X 2013:2004)

Encoding::decode(dest, dest_size, src, src_size, encoding)
	指定した文字コードのテキストをUnicodeコードポイント配列に変換し,
	実際に格納されたコードポイント数を返します.
	destがnullptrだった場合はdestに必要なサイズのみ計算して返します.

Encoding::encode(dest, dest_size, src, src_size, encoding)
	Unicodeコードポイント配列を指定した文字コードのテキストに変換し,
	実際に格納されたバイト数を返します.
	destがnullptrだった場合はdestに必要なサイズのみ計算して返します.
	(まだ実装してないです...)

----------------------------------------
JIS X 0213 to Unicode変換テーブル
	x0213.orgの「JIS X 0213:2004 漢字8ビット符号とUnicodeの対応表」を元に
	機械変換を行って作成しています.
	http://x0213.org/codetable/jisx0213-2004-8bit-std.txt
	元のテーブルでUnicode側が2文字シーケンス(「か゜」など)になっているものは
	U+FFFD(判定不能文字)へ割り当てています.

----------------------------------------
文字コード判定
	Jcode.pmの方法を参考にしています.

About

Shift_JIS, EUC-JP, UTF-8, UTF-16LE/BEをUnicodeコードポイントに変換する.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages