Tag Archives: 文字コード

[C#]指定されたASCIIコードをstring型の文字列に変換する

2012年10月9日 (カテゴリ: C#:, )

C#で、数字で指定されたASCIIコードをstring型の文字列に変換する方法です。 基本的には、charにキャストした上でToString()をコールすれば良いです。 int data = 2; string ans = ((char)data).ToString(); これで、ans には0x02(制御コードのSTX)が入ります。 キャストを忘れると正しく動作しません。 以下のコードだとansには”2″(数字の2)が入ってしまいます。 string ans = (data).ToString(&…


続きを読む

[C#]文字列中の制御文字を、[CR][LF]や[0D][0A]のように可視化する

2012年10月2日 (カテゴリ: C#:, , )

Stringオブジェクトの文字列中に制御文字(0x00~0x19)が入ると、TextBoxなどに値を表示する際、制御文字が入っている事を確認する事が出来ません。 このような場合、制御文字を他のテキスト文字に置き換えると分かりやすいです。 という訳で今回は、制御文字を可視化(例えば0x02を[STX]に置き換えるなど)させるコードを紹介します。 変換作業は、正規表現による置換機能を利用します。正規表現を使って制御文字をマッチさせたいのですが、幸いな事に.Netでは、制御文字は「\p{Cc}」というパターンであらわす事が可能です。 「\p{Cc}」って何???と思われるかもしれませんが、分解して考…


続きを読む

[PHP] DOMDocument#loadHTML()で、特定の文字が含まれていると正しいDOMを作ってくれない

2012年1月26日 (カテゴリ: PHP:)

DOMDocument#loadHTML()の出力がおかしい PHPで、DOMDocument#loadHTML()を使用すると、HTMLのテキストからDomのツリーを作成することが出来ます。 とあるファイルを、loadHTML()したのですが、なぜか正しくツリーが作られないことがありました。 しかも、まったく作られない訳ではなく途中で途切れてしまう。 中身を調べてみると、”㈱”(かっこかぶ:機種依存文字)や、”鎌”の文字が出てきたところで解析が打ち切られています。”かっこかぶ”は明らかにヤバそうですが、”鎌&…


続きを読む