<pre id="bbfd9"><del id="bbfd9"><dfn id="bbfd9"></dfn></del></pre>

          <ruby id="bbfd9"></ruby><p id="bbfd9"><mark id="bbfd9"></mark></p>

          <p id="bbfd9"></p>

          <p id="bbfd9"><cite id="bbfd9"></cite></p>

            <th id="bbfd9"><form id="bbfd9"><dl id="bbfd9"></dl></form></th>

            <p id="bbfd9"><cite id="bbfd9"></cite></p><p id="bbfd9"></p>
            <p id="bbfd9"><cite id="bbfd9"><progress id="bbfd9"></progress></cite></p>
            php語言

            php抓取https的內容的代碼

            時間:2025-03-28 10:15:52 php語言 我要投稿
            • 相關推薦

            php抓取https的內容的代碼

              大家有時候需要獲取https網頁的內容,下面得方法,可以參考下。就跟隨百分網小編一起去了解下吧,想了解更多相關信息請持續關注我們應屆畢業生考試網!

              直接用file_get_contents,會報錯;

              復制代碼 代碼如下:

              $url = (https://xxx.com");

              file_get_contents($url);

              錯誤:

              Warning: file_get_contents(https://xxx.com) [function.file-get-contents]: failed to open stream: No such file or directory in D:wampwwwgrabber_clientindex.php on line 3

              用curl的方式是可以的:

              復制代碼 代碼如下:

              $url = (https://xxx.com);

              $ch = curl_init();

              curl_setopt($ch, CURLOPT_URL,$url);

              curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);

              curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);

              $result = curl_exec($ch);

              print_r($result);

              ?>

              重點是以下兩句:

              復制代碼 代碼如下:

              curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);

              curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);

              如對本文有疑問,請提交到交流社區,廣大熱心網友會為你解答!! 點擊進入社區

              為方便說明,先上代碼吧

              復制代碼 代碼如下:

              /**

              * curl POST

              *

              * @param   string  url

              * @param   array   數據

              * @param   int     請求超時時間

              * @param   bool    HTTPS時是否進行嚴格認證

              * @return  string

              */

              function curlPost($url, $data = array(), $timeout = 30, $CA = true){

              $cacert = getcwd() . '/cacert.pem'; //CA根證書

              $SSL = substr($url, 0, 8) == "https://" ? true : false;

              $ch = curl_init();

              curl_setopt($ch, CURLOPT_URL, $url);

              curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);

              curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout-2);

              if ($SSL && $CA) {

              curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, true);   // 只信任CA頒布的證書

              curl_setopt($ch, CURLOPT_CAINFO, $cacert); // CA根證書(用來驗證的網站證書是否是CA頒布)

              curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2); // 檢查證書中是否設置域名,并且是否與提供的主機名匹配

              } else if ($SSL && !$CA) {

              curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); // 信任任何證書

              curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1); // 檢查證書中是否設置域名

              }

              curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

              curl_setopt($ch, CURLOPT_HTTPHEADER, array('Expect:')); //避免data數據過長問題

              curl_setopt($ch, CURLOPT_POST, true);

              curl_setopt($ch, CURLOPT_POSTFIELDS, $data);

              //curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data)); //data with URLEncode

              $ret = curl_exec($ch);

              //var_dump(curl_error($ch));  //查看報錯信息

              curl_close($ch);

              return $ret;

              }

              如果URL地址是https打頭,那就走SSL,否則就走普通的HTTP協議。

              是否走HTTPS的話就安全了嗎?其實SSL也有不同的驗證程度。

              例如需不需要驗證證書中的公用名呢?(BTW:公用名(Common Name)一般來講就是填寫你將要申請SSL證書的域名 (domain)或子域名(sub domain)。)

              需要驗證主機名嗎?

              是任何證書都信任呢還是只信任CA頒布的呢?

              (我擦嘞,電池快沒點了,只撿關鍵地兒說了 - -|||)

              如果網站SSL證書買的是CA的(通常比較貴),那么訪問時可以使用比較嚴格的認證,即:

              復制代碼 代碼如下:

              curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, true);   // 只信任CA頒布的證書

              curl_setopt($ch, CURLOPT_CAINFO, $cacert); // CA根證書(用來驗證的網站證書是否是CA頒布)

              curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2); // 檢查證書中是否設置域名,并且是否與提供的主機名匹配

              如果網站的證書是自己生成的,或者是網上的小機構申請的,那么訪問時如果使用嚴格認證則不會通過,直接返回false。(對了,返回false時可以打印curl_error($ch)查看具體錯誤信息。)此時可以根據情況通過降低驗證程度來保證正常訪問,例如:

              復制代碼 代碼如下:

              curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); // 信任任何證書

              curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1); // 檢查證書中是否設置域名(為0也可以,就是連域名存在與否都不驗證了)

              平時我們使用瀏覽器訪問各個https網站時,有時會遇到證書不受信的提示,其實就是因為這些網站的證書不是正規CA機構頒布的。

              市面上各種瀏覽器中都內置了CA根證書列表信息,訪問有CA頒布證書的網站時,會根據根證書驗證這些網站的證書,所以就不會有這個提示了。

              關于CA根證書文件,其實就是包含了各個主要CA機構的公鑰證書,用來驗證網站的證書是否是這些機構頒發的。

              這里的這個文件是來源于mozilla的源碼樹,又轉換成PEM格式證書文件。(大家可以到這里下載現成的http://curl.haxx.se/ca/cacert.pem)

              最后說一個和SSL無關的東西:

              復制代碼 代碼如下:

              curl_setopt($ch, CURLOPT_HTTPHEADER, array('Expect:'));

              這個主要是為了解決POST時數據過長問題

            【php抓取https的內容的代碼】相關文章:

            PHP實現抓取HTTPS內容09-17

            php抓取頁面的方法08-24

            php抓取頁面的的方法06-09

            PHP代碼優化技巧09-10

            PHP實用的代碼實例08-12

            php分頁類代碼09-08

            PHP調用的C代碼08-05

            PHP代碼運行流程08-14

            PHP代碼如何規范08-28

                    <pre id="bbfd9"><del id="bbfd9"><dfn id="bbfd9"></dfn></del></pre>

                    <ruby id="bbfd9"></ruby><p id="bbfd9"><mark id="bbfd9"></mark></p>

                    <p id="bbfd9"></p>

                    <p id="bbfd9"><cite id="bbfd9"></cite></p>

                      <th id="bbfd9"><form id="bbfd9"><dl id="bbfd9"></dl></form></th>

                      <p id="bbfd9"><cite id="bbfd9"></cite></p><p id="bbfd9"></p>
                      <p id="bbfd9"><cite id="bbfd9"><progress id="bbfd9"></progress></cite></p>
                      飘沙影院