综合五月天,www.99,国产老女人卖婬

當(dāng)前位置：首頁 > 范文|應(yīng)用文 > IT技術(shù)專欄 > 網(wǎng)絡(luò)編程

PHP讀取大文件的多種方法介紹

來源：易賢網(wǎng) 閱讀：1045 次日期：2016-08-27 13:28:28

溫馨提示：易賢網(wǎng)小編為您整理了“PHP讀取大文件的多種方法介紹”,方便廣大網(wǎng)友查閱！

讀取大文件一直是一個頭痛的問題，我們像使用php開發(fā)讀取小文件可以直接使用各種函數(shù)實(shí)現(xiàn)，但一到大文章就會發(fā)現(xiàn)常用的方法是無法正常使用或時間太長太卡了，下面我們就一起來看看關(guān)于php讀取大文件問題解決辦法，希望例子能幫助到各位。

在PHP中，對于文件的讀取時，最快捷的方式莫過于使用一些諸如file、file_get_contents之類的函數(shù)，簡簡單單的幾行代碼就能很漂亮的完成我們所需要的功能。但當(dāng)所操作的文件是一個比較大的文件時，這些函數(shù)可能就顯的力不從心, 下面將從一個需求入手來說明對于讀取大文件時，常用的操作方法。

需求:

有一個800M的日志文件，大約有500多萬行，用PHP返回最后幾行的內(nèi)容。

實(shí)現(xiàn)方法:

1. 直接采用file函數(shù)來操作

由于 file函數(shù)是一次性將所有內(nèi)容讀入內(nèi)存，而PHP為了防止一些寫的比較糟糕的程序占用太多的內(nèi)存而導(dǎo)致系統(tǒng)內(nèi)存不足，使服務(wù)器出現(xiàn)宕機(jī)，所以默認(rèn)情況下限制只能最大使用內(nèi)存16M,這是通過php.ini里的 memory_limit = 16M 來進(jìn)行設(shè)置，這個值如果設(shè)置-1，則內(nèi)存使用量不受限制。

下面是一段用file來取出這具文件最后一行的代碼：

<?php

　　ini_set('memory_limit', '-1');

　　$file = 'access.log';

　　$data = file($file);

　　$line = $data[count($data) - 1];

　　echo $line;

整個代碼執(zhí)行完成耗時 116.9613 (s)。

我機(jī)器是2個G的內(nèi)存，當(dāng)按下F5運(yùn)行時，系統(tǒng)直接變灰，差不多20分鐘后才恢復(fù)過來，可見將這么大的文件全部直接讀入內(nèi)存，后果是多少嚴(yán)重，所以不在萬不得以，memory_limit這東西不能調(diào)得太高，否則只有打電話給機(jī)房，讓reset機(jī)器了。

2.直接調(diào)用Linux的 tail 命令來顯示最后幾行

在Linux命令行下，可以直接使用 tail -n 10 access.log 很輕易的顯示日志文件最后幾行，可以直接用PHP來調(diào)用tail命令，執(zhí)行PHP代碼如下:

<?php

$file = 'access.log';

$file = escapeshellarg($file); // 對命令行參數(shù)進(jìn)行安全轉(zhuǎn)義

$line = `tail -n 1 $file`;

echo $line;

整個代碼執(zhí)行完成耗時 0.0034 (s)

3. 直接使用PHP的 fseek 來進(jìn)行文件操作

這種方式是最為普遍的方式，它不需要將文件的內(nèi)容全部讀入內(nèi)容，而是直接通過指針來操作，所以效率是相當(dāng)高效的。在使用fseek來對文件進(jìn)行操作時，也有多種不同的方法，效率可能也是略有差別的，下面是常用的兩種方法：

方法一

首先通過fseek找到文件的最后一位EOF，然后找最后一行的起始位置，取這一行的數(shù)據(jù)，再找次一行的起始位置，再取這一行的位置，依次類推，直到找到了$num行。

實(shí)現(xiàn)代碼如下:

<?php

$fp = fopen($file, "r");

$line = 10;

$pos = -2;

$t = " ";

$data = "";

while ($line > 0)

{

while ($t != "＼n")

{

fseek($fp, $pos, SEEK_END);

$t = fgetc($fp);

$pos--;

}

$t = " ";

$data .= fgets($fp);

$line--;

}

fclose($fp);

echo $data

整個代碼執(zhí)行完成耗時 0.0095 (s)

方法二

還是采用fseek的方式從文件最后開始讀，但這時不是一位一位的讀，而是一塊一塊的讀，每讀一塊數(shù)據(jù)時，就將讀取后的數(shù)據(jù)放在一個buf里，然后通過換行符(＼n)的個數(shù)來判斷是否已經(jīng)讀完最后$num行數(shù)據(jù)。

實(shí)現(xiàn)代碼如下:

<?php

$fp = fopen($file, "r");

$num = 10;

$chunk = 4096;

$fs = sprintf("%u", filesize($file));

$max = (intval($fs) == PHP_INT_MAX) ? PHP_INT_MAX : filesize($file);

for ($len = 0; $len < $max; $len += $chunk)

{

$seekSize = ($max - $len > $chunk) ? $chunk : $max - $len;

fseek($fp, ($len + $seekSize) * -1, SEEK_END);

$readData = fread($fp, $seekSize) . $readData;

if (substr_count($readData, "＼n") >= $num + 1)

{

preg_match("!(.*?＼n){" . ($num) . "}$!", $readData, $match);

$data = $match[0];

break;

}

fclose($fp);

echo $data;

整個代碼執(zhí)行完成耗時 0.0009(s)。

方法三

<?php

function tail($fp, $n, $base = 5)

{

assert($n > 0);

$pos = $n + 1;

$lines = array();

while (count($lines) <= $n)

{

try

{

fseek($fp, -$pos, SEEK_END);

}

catch (Exception $e)

{

fseek(0);

break;

}

$pos *= $base;

while (!feof($fp))

{

array_unshift($lines, fgets($fp));

}

return array_slice($lines, 0, $n);

}

var_dump(tail(fopen("access.log", "r+"), 10));

整個代碼執(zhí)行完成耗時 0.0003(s)

方法四，PHP的stream_get_line函數(shù) ，讀取快速，讀取50萬條數(shù)據(jù)大文件，大概需要20秒左右的時間！例子代碼如下:

$fp = fopen('./iis.log', 'r'); //文件

while (!feof($fp)) {

//for($j=1;$j<=1000;$j++) { //讀取下面的1000行并存儲到數(shù)組中

$logarray[] = stream_get_line($fp, 65535, "＼n");

// break;

// }

}

以上就是php讀取大文件的四種方法，希望對大家的學(xué)習(xí)有所幫助。

更多信息請查看網(wǎng)絡(luò)編程

上一篇：PHP如何使用Memcached

下一篇：PHP如何將XML轉(zhuǎn)成數(shù)組

易賢網(wǎng)手機(jī)網(wǎng)站地址：PHP讀取大文件的多種方法介紹

由于各方面情況的不斷調(diào)整與變化，易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考，敬請考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)！

相關(guān)閱讀網(wǎng)絡(luò)編程

Shell中如何刪除文本比較長的行的實(shí)現(xiàn)方法10月30日

vue.js語法及常用指令10月30日

python 讀寫中文json的實(shí)例詳解10月30日

Objective-C Json 實(shí)例詳解10月30日

bootstrap table sum總數(shù)量統(tǒng)計(jì)實(shí)現(xiàn)方法10月30日

python生成二維碼的實(shí)例詳解10月30日

Python批量更改文件名的實(shí)現(xiàn)方法10月30日

解決出現(xiàn)Incorrect integer value的問題10月30日

jQuery實(shí)現(xiàn)切換隱藏與顯示同時切換圖標(biāo)功能10月30日

docker python api 安裝配置的詳解10月30日

javascript按鈕禁用和啟用的效果實(shí)例代碼10月30日

vue.js todolist實(shí)現(xiàn)代碼10月30日

vue.js 父向子組件傳參的實(shí)例代碼10月30日

apache 開啟重定向 rewrite的實(shí)現(xiàn)方法10月30日

Vue.js劃分組件的方法10月30日

python logging日志模塊的詳解10月30日

vue中的scope使用詳解10月30日

docker cgroup 資源監(jiān)控的詳解10月30日

使用Android Studio 開發(fā)自己的SDK教程10月23日

linux系統(tǒng)下MongoDB單節(jié)點(diǎn)安裝教程10月23日

易賢網(wǎng)移動網(wǎng)站

2025國考·省考課程試聽報(bào)名

報(bào)班類型
姓名
手機(jī)號
驗(yàn)證碼