用PHP實現(xiàn)簡單采集數(shù)據(jù)入庫-創(chuàng)新互聯(lián)

本篇內容介紹了“用PHP實現(xiàn)簡單采集數(shù)據(jù)入庫”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

在湯旺等地區(qū),都構建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務理念,為客戶提供成都網(wǎng)站設計、網(wǎng)站建設 網(wǎng)站設計制作定制制作,公司網(wǎng)站建設,企業(yè)網(wǎng)站建設,品牌網(wǎng)站設計,營銷型網(wǎng)站建設,外貿網(wǎng)站制作,湯旺網(wǎng)站建設費用合理。

說到采集,無非就是遠程獲取信息->提取所需內容->分類存儲->讀取->展示

也算是簡單"小偷程序"的加強版吧

下面是對應核心代碼(別拿去做壞事哦^_^)

所要采集的內容是某游戲網(wǎng)站上的公告,如下圖:

用PHP實現(xiàn)簡單采集數(shù)據(jù)入庫

可先利用file_get_contents和簡單正則獲取基本頁面信息

用PHP實現(xiàn)簡單采集數(shù)據(jù)入庫

整理下基本信息,采集入庫:

<?php
  include_once("conn.php");


   if($_GET['id']<=8&&$_GET['id']){
     $id=$_GET['id'];
    $conn=file_get_contents("http://www.93moli.com/news_list_4_$id.html");//獲取頁面內容
  
  $pattern="/<li><a title=\"(.*)\" target=\"_blank\" href=\"(.*)\">/iUs";//正則

  preg_match_all($pattern, $conn, $arr);//匹配內容到arr數(shù)組

  //print_r($arr);die;
  
  foreach ($arr[1] as $key => $value) {//二維數(shù)組[2]對應id和[1]剛好一樣,利用起key
    $url="http://www.93moli.com/".$arr[2][$key];
    $sql="insert into list(title,url) value ('$value', '$url')";
    mysql_query($sql);

    //echo "<a href='content.php?url=http://www.93moli.com/$url'>$value</a>"."<br/>";  
  }
   $id++;
   echo "正在采集URL數(shù)據(jù)列表$id...請稍后...";
   echo "<script>window.location='list.php?id=$id'</script>";

 }else{
   echo "采集數(shù)據(jù)結束。";
 }

?>

conn.php是數(shù)據(jù)庫連接文件

list.php是本頁面

由于要采集的數(shù)據(jù)是分頁顯示的,且頁面地址是規(guī)律遞增,所以我用了js跳轉代碼,利用id傳值控制采集的頁數(shù),也避免了for循環(huán)數(shù)目過大。

用PHP實現(xiàn)簡單采集數(shù)據(jù)入庫

用PHP實現(xiàn)簡單采集數(shù)據(jù)入庫

輕輕松松數(shù)據(jù)入庫,下篇文章寫關于具體url采集信息的過程。

“用PHP實現(xiàn)簡單采集數(shù)據(jù)入庫”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關的知識可以關注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質量的實用文章!

網(wǎng)頁題目:用PHP實現(xiàn)簡單采集數(shù)據(jù)入庫-創(chuàng)新互聯(lián)
標題網(wǎng)址:http://muchs.cn/article22/dhdjjc.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供微信公眾號、網(wǎng)站建設、App開發(fā)品牌網(wǎng)站制作、云服務器靜態(tài)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

商城網(wǎng)站建設