盲反饋檢索系統(tǒng)實驗記錄二

在實驗記錄一中我們提到了一個獲取所有txt格式的IT新聞內(nèi)容的方法fileStr,在獲取內(nèi)容的同時我們也計算出了每篇新聞的長度(包括標(biāo)點符號):

在西鄉(xiāng)等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供網(wǎng)站制作、成都網(wǎng)站制作 網(wǎng)站設(shè)計制作按需開發(fā)網(wǎng)站,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),品牌網(wǎng)站制作,網(wǎng)絡(luò)營銷推廣,外貿(mào)營銷網(wǎng)站建設(shè),西鄉(xiāng)網(wǎng)站建設(shè)費用合理。

//獲取每篇文檔的內(nèi)容和長度
static public function fileStr(){
    $file_dir=self::fileDir(TEXT_PATH);
    $str=array();   //存儲文檔和長度
    for($i=0;$i<count($file_dir);$i++){
        $str[$i]['con']=file_get_contents(TEXT_PATH.'/'.$file_dir[$i]); //讀取文本
        $str[$i]['con']=preg_replace('/\s+/','',$str[$i]['con']);       //消除空格,這樣做就不適合英文檢索
        $str[$i]['len']=mb_strlen($str[$i]['con'],'gbk');       //文本長度
    }
    return $str;
}

fileStr方法調(diào)用了工具類定義的一個靜態(tài)方法fileDir,fileDir返回的是IT新聞目錄下所有文件的文件名。fileStr方法通過一個for循環(huán)獲取每篇文檔的內(nèi)容,并把它們放入一個二維數(shù)組$str中,其中$str[i]['con']保存大的是第i篇文檔的內(nèi)容,$str[i]['len']保存的是第i篇文檔的長度:

盲反饋檢索系統(tǒng)實驗記錄二

fileDir方法的代碼如下:

//取出所有文檔目錄
static public function fileDir($path){
    $files_name=array();
    $dir=opendir($path);
    while (false!==($file=readdir($dir))) {
        if ($file != "." && $file != ".."){
            $files_name[]=$file;
        }
    }
    closedir($dir);
    return $files_name;
}

該方法需要傳遞一個參數(shù),該參數(shù)保存的是新聞文件的目錄。通過opendir目錄函數(shù)讀取目錄文件,并把文件名存在數(shù)組$file_name中:

盲反饋檢索系統(tǒng)實驗記錄二

新聞標(biāo)題:盲反饋檢索系統(tǒng)實驗記錄二
轉(zhuǎn)載來于:http://muchs.cn/article36/jopdsg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站制作網(wǎng)頁設(shè)計公司、服務(wù)器托管、自適應(yīng)網(wǎng)站靜態(tài)網(wǎng)站、搜索引擎優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)公司