@zundan その出力に含まれるのは7bit ASCIIのテキストなのでiso-8859-1でバイト列から文字列に変換できて、次のHTMLパースの段階で文字参照はUnicode文字になります。レスポンスヘッダの文字コード指定は前者の方でちゃんと適用されています。