728x90
반응형

국내 웹페이중에 charset이 KSC5601로 설정되어 있는 페이지들이 많다.

 

이 페이지를 simple_html_dom으로 파싱하려고 하면 아래와 같은 오류가 발생한다.

 

 

 

 

 

iconv(): Wrong charset, conversion from `KSC5601' to `UTF-8' is not allowed in simple_html_dom.php

 

 

 

 

 

 

이 경우 KSC5601을 CP949로 바꿔주면 해결된다.

 

 

 

simple_html_dom.php를 아래와 같이 수정해주자.

1
생략
784
785
786
787
789
790
791
792
793
794
795
생략
1724
<?php
...           
            if ((strcasecmp($targetCharset'UTF-8'== 0&& ($this->is_utf8($text)))
            {
                $converted_text = $text;
            }
            else
            {
              if ($sourceCharset == 'KSC5601') {
                $sourceCharset = 'CP949';
              }
                $converted_text = iconv($sourceCharset$targetCharset$text);
            }
...
?>
cs

791~793 삽입

728x90
반응형

+ Recent posts