• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

PHP爬取网页中表格数据

原作者: [db:作者] 来自: [db:来源] 收藏 邀请
        public function spider_j($page)
            {
                $url="http://aaa/bbb".$page."_0/"; 
                   
                $fcontents=file_get_contents($url);  

                $table_data = preg_match_all('#<table>(.*?)</table>#si',$fcontents,$match);

                $table_data = $match[0][0];

                $table_array = explode('<tr>',$table_data);
             
                $data = array();

                for($i=2;$i<count($table_array);$i++){
                    $data[$i] = explode('</td>',$table_array[$i]);
                    for($j = 0;$j<count($data[$i]);$j++){
                        $data[$i][$j] = preg_replace('/\s(?=\s)/','',trim(strip_tags($data[$i][$j])));
                    }
                    $data[$i][6] = date('Y-m-d');
                }

                $kname = array('ID', 'GAMENAME', 'GATEGORY','BETA', 'DATA', 'DOWNLOAD','THEDATE');

                foreach($data as $key=>&$val){
                    $val = array_combine($kname,$val);
                } 
            
                for($i=2;$i<(count($data)+2);$i++){
                    $this->db06->insert('TBL_J',$data[$i]);
                }       
        
            }
                      
           public function spider()
            { 
                for($i=1;$i<11;$i++){
                    $this->spider_j($i);    
                }                                                                     
            }

逻辑:把网页代码读到字符串中,通过正则表达式筛选出指定的数据,然后变成二维数组,插入到数据库里。


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
PHPmysqli_stmt_bind_paramMySQLi函数发布时间:2022-07-10
下一篇:
PHP7添加swoole扩展发布时间:2022-07-10
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap