基于PHP讀取TXT文件向數(shù)據(jù)庫(kù)導(dǎo)入海量數(shù)據(jù)的方法_PHP教程
推薦:php判斷終端是手機(jī)還是電腦訪(fǎng)問(wèn)網(wǎng)站代碼?php function check_wap() { if (isset($_SERVER['HTTP_VIA'])) return true; if (isset($_SERVER['HTTP_X_NOKIA_CONNECTION_MODE'])) return true; if (isset($_SERVER['HTTP_X_UP_CALLING_LINE_ID'])) return true; if (strpos(strtoupper($_SERVER['HTTP_ACCEPT']),
有一個(gè)TXT文件,包含了10萬(wàn)條記錄,格式如下:
列1 列2 列3 列4 列5
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1
……………………后面有10萬(wàn)條………………
需求是要導(dǎo)入數(shù)據(jù)庫(kù)中,數(shù)據(jù)表的結(jié)構(gòu)為
word_id 自動(dòng)增量
word 【adductive#1 adducting#1 adducent#1】這一個(gè)TXT記錄要轉(zhuǎn)換為3個(gè)SQL記錄
value =第三列-第四列;如果=0,則此條記錄略過(guò)不插入數(shù)據(jù)表
<?php
$file = 'words.txt';//10W條記錄的TXT源文件
$lines = file_get_contents($file);
ini_set('memory_limit', '-1');//不要限制Mem大小,否則會(huì)報(bào)錯(cuò)
$line=explode("\n",$lines);
$i=0;
$sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES ";
foreach($line as $key =>$li)
{
$arr=explode(" ",$li);
$senti_value=$arr[2]-$arr[3];
if($senti_value!=0)
{
if($i>=20000&&$i<25000)//分批次導(dǎo)入,避免失敗
{
$mm=explode(" ",$arr[4]);
foreach($mm as $m) //【adductive#1 adducting#1 adducent#1】這一個(gè)TXT記錄要轉(zhuǎn)換為3個(gè)SQL記錄 {
$nn=explode("#",$m);
$word=$nn[0];
$sql.="(\"$word\",1,$senti_value,2),";//這個(gè)地方要注意到是 word有可能包含單引號(hào)(如jack's),因此我們要用雙引號(hào)來(lái)包含word(注意轉(zhuǎn)義)
}
}
$i++;
}
}
//echo $i;
$sql=substr($sql,0,-1);//去掉最后一個(gè)逗號(hào)
//echo $sql;
file_put_contents('20000-25000.txt', $sql); //批量導(dǎo)入數(shù)據(jù)庫(kù),5000條一次,大概需要40秒的樣子;一次導(dǎo)入太多max_execution_time會(huì)不夠,導(dǎo)致失敗
?>
1,海量數(shù)據(jù)導(dǎo)入到時(shí)候,要注意PHP的一些限制,可以臨時(shí)調(diào)整一下,否則會(huì)報(bào)錯(cuò)
Allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)
2,PHP操作TXT文件
file_get_contents()
file_put_contents()
3,海量導(dǎo)入的時(shí)候,最好分批次導(dǎo)入,失敗的幾率小一些
4,海量導(dǎo)入之前,腳本一定要多次測(cè)試無(wú)誤再使用,比如用100條數(shù)據(jù)來(lái)測(cè)試
5,導(dǎo)入之后,如果PHP的mem_limit還是不夠的話(huà),程序仍然跑不起來(lái)
(建議用修改php.ini的方式來(lái)提高mem_limit,而不是用臨時(shí)的語(yǔ)句)
分享:實(shí)現(xiàn)PHP頁(yè)面靜態(tài)化?php //首先查看緩存文件if(file_exists(static.html)){//緩存時(shí)間為3分鐘if(time()-filemtime(static.html)60*3){//將靜態(tài)文件內(nèi)容返回給客戶(hù)端$start_time = microtime();echo 我是從靜態(tài)文件中讀取的數(shù)據(jù):.br/;echo file_get_contents(static.html);$end_time = mic
- PHPNOW安裝Memcached擴(kuò)展方法詳解
- php記錄頁(yè)面代碼執(zhí)行時(shí)間
- PHP中獎(jiǎng)概率的抽獎(jiǎng)算法程序代碼
- apache設(shè)置靜態(tài)文件緩存方法介紹
- php對(duì)圖像的各種處理函數(shù)代碼小結(jié)
- PHP 關(guān)于訪(fǎng)問(wèn)控制的和運(yùn)算符優(yōu)先級(jí)介紹
- 關(guān)于PHP語(yǔ)言構(gòu)造器介紹
- php/js獲取客戶(hù)端mac地址的實(shí)現(xiàn)代碼
- php5.5新數(shù)組函數(shù)array_column使用
- PHP preg_match的匹配多國(guó)語(yǔ)言的技巧
- php 中序列化和json使用介紹
- php采集文章中的圖片獲取替換到本地
- 相關(guān)鏈接:
復(fù)制本頁(yè)鏈接| 搜索基于PHP讀取TXT文件向數(shù)據(jù)庫(kù)導(dǎo)入海量數(shù)據(jù)的方法
- 教程說(shuō)明:
PHP教程-基于PHP讀取TXT文件向數(shù)據(jù)庫(kù)導(dǎo)入海量數(shù)據(jù)的方法。