概要
应同学邀请,演示如何使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。
下面测试的是一个廉价机票预订网站(http://www.flyscoot.com/),关键点如下
- 使用 QWebEngineView 加载网页,并显示进度。
- 在默认配置(QWebEngineProfile)中植入 Javascript 内容,这样脚本会在所有打开的网页中执行,不论跳转到哪个网址。
- Javascript 脚本使用网址中的路径名,判断当前网页位置,从而决定执行哪种操作。
python 代码示例
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
|
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
'''使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。'''
import os
import sys
from datetime import datetime
from PyQt5.QtWidgets import (
QWidget, QApplication, QVBoxLayout, QHBoxLayout,
QDesktopWidget, QTextEdit, QLabel, QLineEdit, QPushButton,
QFileDialog, QProgressBar,
)
from PyQt5.QtCore import QUrl, pyqtSlot
from PyQt5.QtWebEngineWidgets import QWebEngineView, QWebEngineProfile, QWebEngineScript, QWebEnginePage
class Browser(QWidget):
def __init__( self ):
super ().__init__()
self .init_ui()
# 脚本
self .profile = QWebEngineProfile.defaultProfile()
self .script = QWebEngineScript()
self .prepare_script()
def init_ui( self ):
self .webView = QWebEngineView()
self .logEdit = QTextEdit()
self .logEdit.setFixedHeight( 100 )
self .addrEdit = QLineEdit()
self .addrEdit.returnPressed.connect( self .load_url)
self .webView.urlChanged.connect(
lambda i: self .addrEdit.setText(i.toDisplayString()))
self .jsEdit = QLineEdit()
self .jsEdit.setText( 'inject.js' )
loadUrlBtn = QPushButton( '加载' )
loadUrlBtn.clicked.connect( self .load_url)
chooseJsBtn = QPushButton( '选择脚本文件' )
chooseJsBtn.clicked.connect( self .choose_js_file)
# 导航/工具
top = QWidget()
top.setFixedHeight( 80 )
topBox = QVBoxLayout(top)
topBox.setSpacing( 0 )
topBox.setContentsMargins( 5 , 0 , 0 , 5 )
progBar = QProgressBar()
progBox = QHBoxLayout()
progBox.addWidget(progBar)
topBox.addLayout(progBox)
naviBox = QHBoxLayout()
naviBox.addWidget(QLabel( '网址' ))
naviBox.addWidget( self .addrEdit)
naviBox.addWidget(loadUrlBtn)
topBox.addLayout(naviBox)
naviBox = QHBoxLayout()
naviBox.addWidget(QLabel( '注入脚本文件' ))
naviBox.addWidget( self .jsEdit)
naviBox.addWidget(chooseJsBtn)
topBox.addLayout(naviBox)
self .webView.loadProgress.connect(progBar.setValue)
# 主界面
layout = QVBoxLayout( self )
layout.addWidget( self .webView)
layout.addWidget(top)
layout.addWidget( self .logEdit)
self .show()
self .resize( 1024 , 900 )
self .center()
def center( self ):
qr = self .frameGeometry()
cp = QDesktopWidget().availableGeometry().center()
qr.moveCenter(cp)
self .move(qr.topLeft())
@pyqtSlot ()
def load_url( self ):
url = self .addrEdit.text().strip()
if not url.lower().startswith( 'http://' ) \
and not url.lower().startswith( 'https://' ):
url = 'http://{}' . format (url)
self .load(url)
@pyqtSlot ()
def choose_js_file( self ):
f, _ = QFileDialog.getOpenFileName( filter = "Javascript files(*.js)" )
if os.path.isfile(f):
self .jsEdit.setText(f)
self .prepare_script()
def prepare_script( self ):
path = self .jsEdit.text().strip()
if not os.path.isfile(path):
self .log( 'invalid js path' )
return
self .profile.scripts().remove( self .script)
with open (path, 'r' ) as f:
self .script.setSourceCode(f.read())
self .profile.scripts().insert( self .script)
self .log( 'injected js ready' )
def log( self , msg, * args, * * kwargs):
m = msg. format ( * args, * * kwargs)
self .logEdit.append( '{} {}' . format (
datetime.now().strftime( '%H:%M:%S' ), m))
def load( self , url):
self .log(f 'loading {url}' )
self .addrEdit.setText(url)
self .webView.load(QUrl(url))
if __name__ = = '__main__' :
app = QApplication(sys.argv)
b = Browser()
b.load( 'http://www.flyscoot.com/' )
sys.exit(app.exec_())
|
Javascript 脚本示例
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
// 简单起见,这里只演示部分页面,脚本内容摘自 Heng丶原贴文。
function handle(path) {
// 首页
if (path == '/zh' ) {
document.getElementsByClassName( 'radio-inline' )[1].click();
document.getElementById( 'oneway_from' ).value= '广州 (CAN)' ;
document.getElementById( 'oneway_to' ).value= '新加坡 (SIN)' ;
document.getElementById( 'oneway_departuredate' ).value= '2018年9月10日' ;
document.getElementsByClassName( 'btn--booking' )[1].click();
return ;
}
// 选择航班
if (path == '/Book/Flight' ) {
document.getElementsByClassName( 'price--sale' )[0].click();
document.getElementsByClassName( 'heading-4' )[0].click();
document.getElementsByClassName( 'btn-submit' )[0].click();
return ;
}
// 乘客信息
if (path == '/BookFlight/Passengers' ) {
document.getElementsByClassName( 'fname1' )[0].value = "匿名" ;
}
}
let host = document.location.hostname;
if (host.endsWith( '.flyscoot.com' )) {
handle(document.location.pathname);
}
|
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对服务器之家的支持。如果你想了解更多相关内容请查看下面相关链接
原文链接:https://segmentfault.com/a/1190000016222966