Daily Archives: 2012年11月12日

[PHP]file_get_contenst()で複数サイトのhtmlを非同期・高速に取得する

2012年11月12日 (カテゴリ: PHP:)

PHPでは、file_get_contenst()関数にURLを指定する事で、他のサイトのhtmlテキストを取得できます。 1つのサイトだけを取得する場合はこれでよいのですが、大量のサイトからデータを取得する場合、 1サイトつづ順番に関数を呼んでいたら非常に時間が掛かります。 このような場合はcURLモジュールに有るcurl_multi_getcontent()関数を使用すると、複数サイトの情報を非同期で同時に取得出来ます。 ですが、curl_multi_getcontent()は、リソースの確保・開放処理が必要で、扱いがちょっと煩雑です。 この為、今回はfile_get_contenst()…


続きを読む