软件开发培训班 >> 编程开发 >> PHP

PHP使用puppeteer抓取JS渲染后的页面内容

环境依赖

环境	要求
Node	>=7.6.0
PHP	>=7.1
PHP extension	php_sockets, php_exif

游戏魔改历史岳飞并非首个“中招”者	饿了么点外卖折扣后比堂食贵？律师称属于价格欺诈
Windows 7无线密码找回办法	暴瘦近40斤！知名男演员患癌？本人回应！

puppeteer

Puppeteer是一个Node库，我是直接在php项目下使用npm安装这个库，然后借助spatie/browsershot来调用它。读者也可以新建一个node项目安装这个库，然后对外暴漏一个端口通过接口的方式传递url返回html内容的方式实现。

npm i puppeteer --save

离线安装Chromium

安装puppeteer时会下载Chromium，因为众所周知的原因可能会下载不下来，因此下面提供了离线下载的方式。

跳过安装chromium

如果已经运行上一步的命令并且正在下载Chromium了，那可以直接Ctrl+C停止任务。如果还没运行，就使用下面的命令安装。

行走中捕捉风景教你将城市风光拍出特色	低刷就闪屏？显示器误导宣传信了就被坑
Win11优化大师来了：魔改微软默认界面及设置	黄焖鸡卧底记者提醒11点前别点外卖：隔夜菜加热后继续卖

npm i puppeteer --ignore-scripts

获取需要下载的chromium版本号

打开/node_modules/puppeteer/package.json搜索chromium_revision对应的版本号

"puppeteer": {
    "chromium_revision": "756035",
    "firefox_revision": "latest"
}

下载对应版本的chromium

用上面的版本号替换掉下方花括号里的字符，比如我本地是win x64，下载地址就是https://commondatastorage.googleapis.com/chromium-browser-snapshots/Win_x64/756035/chrome-win.zip

mac版下载地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Mac/{chromium版本}/chrome-mac.zip

windows 64位版本下载地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Win_x64/{chromium版本}/chrome-win.zip

windows 32位版本下载地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Win/{chromium版本}/chrome-win.zip

Linux X86版本下载地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Linux/{chromium版本}/chrome-linux.zip

Linux X64版本下载地址:
https://commondatastorage.googleapis.com/chromium-browser-snapshots/Linux_x64/{chromium版本}/chrome-linux.zip

需依赖iPhone/Max！Vision Pro廉价版曝光：苹果降配不能单独使用	邻家有女初长成学拍温暖柔美人像写真
新办的手机号竟然是“旧号码”，关于“二次放号”你了解多少？	一台旧手机30秒被“大卸八块” 探秘华为手机循环处理全过程

解压

将下载下来的chromium安装包解压到puppeteer中的.local_chromium/win64-{chromium版本号}/目录下。以我的为例就是/node_modules/puppeteer/.local_chromium/win64-756035/chrome-win/ 。搞定'

spatie/browsershot

browsershot 是一个composer包，以前还用过的spatie/laravel-permission，都是同一团队制作的

composer require spatie/browsershot

使用

其实困难的部分就是找到合适的工具以及安装工具，真正使用反而很简单。下面列了一个很简单的例子，更多方法还是去看官方文档吧。

<?php
use SpatieBrowsershotBrowsershot;
class Spider
{
    /**
     * 获取html内容
     * @param $url
     * @return string
     */
    public static function getBodyHtml($url)
    {
        return Browsershot::url($url)->bodyHtml();
    }
}

国产自动驾驶芯片突围记	几种比较厉害的伪原创方法
冰箱长期不清洁，竟然比马桶脏23倍？	为什么MacBook Pro看起来厚了？

总结

到此这篇关于PHP使用puppeteer抓取JS渲染后的页面内容的文章就介绍到这了,更多相关PHP获取JS渲染后的页面内容内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

技术文章快速查找

php获得用户ip地址的比较不错的方法

PHP编程获取音频文件时长的方法【基于getid3类】

10个可以简化php开发过程的MySQL工具

php中突破基于HTTP_REFERER的防盗链措施(stream_context_create)

PHP实现自动登入google play下载app report的方法

php实现图片等比例缩放代码

没有mysql支持时的替代方案

PHP 开发环境配置（Zend Studio）

相关下载

· Graphpad Prism 9棱镜科研绘画工具中文版

· 固定资产管理系统(PHP源码)

· Graphpad Prism(棱镜科研绘图工具)

· PHP For Windows

· phpMyAdmin

· phpStudy2018(PHP环境调试)

· JetBrains中文语言包(IDEA/Pycharm/Webstorm/PhpStorm等) 中文语言插件官方版v2022

· Dezender(PHP代码破解工具)

在线教程导航

软件应用
·Windows8	·Windows7	·Word
·Excel	·PPT	·WPS
Web开发
·ASP	·JavaScript	·DIV+CSS
·JSP	·VbScript	·XML
·PHP
开发语言
·VB	·VC	·ASP.NET
·Java	·C++	·Delphi
数据库开发
·MySQL	·MsSQL	·Access
·Oracle	·DB2
手机系统
·Android	·iOS	·WindowsPhone
网站设计
·Flash	·Dreamweaver	·Fireworks
平面设计
·Photoshop	·CorelDraw	·AutoCAD
·3DsMAX	·Illustrator
网络技术
·网站运营	·网络安全	·网络搭建