如何用Python开发一个简单的Webkit浏览器

作者&投稿:虞具 (若有异议请与网页底部的电邮联系)
如何用Python开发一个简单的Webkit浏览器~

举个简单的例子,这个例子十分短小,连 import 语句和空行在内也只有 13 行代码。

Python

import sys

from PyQt4.QtWebKit import QWebView
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl

app = QApplication(sys.argv)

browser = QWebView()
browser.load(QUrl(sys.argv[1]))
browser.show()

app.exec_()

import sys

from PyQt4.QtWebKit import QWebView
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl

app = QApplication(sys.argv)

browser = QWebView()
browser.load(QUrl(sys.argv[1]))
browser.show()

app.exec_()
当你通过命令行将 url 传给脚本时,程序会加载 url 并且在窗口中显示加载完成的页面。

现在,看似你已经有一个“命令行浏览器”啦!至少比 python 的 requests 模块强多了,甚至比 Lynx 还略高一筹,因为我们的浏览器还可以加载 JavaScript 脚本呢。但是目前为止还没有跟 Lynx 拉开差距,因为在启用浏览器的时候只能通过命令行传入 url。

举个简单的例子,这个例子十分短小,连 import 语句和空行在内也只有 13 行代码。

Python

import sys

from PyQt4.QtWebKit import QWebView
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl

app = QApplication(sys.argv)

browser = QWebView()
browser.load(QUrl(sys.argv[1]))
browser.show()

app.exec_()

import sys

from PyQt4.QtWebKit import QWebView
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl

app = QApplication(sys.argv)

browser = QWebView()
browser.load(QUrl(sys.argv[1]))
browser.show()

app.exec_()
当你通过命令行将 url 传给脚本时,程序会加载 url 并且在窗口中显示加载完成的页面。

现在,看似你已经有一个“命令行浏览器”啦!至少比 python 的 requests 模块强多了,甚至比 Lynx 还略高一筹,因为我们的浏览器还可以加载 JavaScript 脚本呢。但是目前为止还没有跟 Lynx 拉开差距,因为在启用浏览器的时候只能通过命令行传入 url。

解决思路:有一个思路最为简单的思路可以动态解析页面信息。urllib不可以解析动态信息,但是浏览器可以。在浏览器上展现处理的信息其实是处理好的HTML文档。这为我们抓取动态页面信息提供了很好的思路。在Python中有一个很有名的图形库——PyQt。PyQt虽然是图形库,但是他里面QtWebkit。这个很实用。谷歌的Chrome和苹果的Safari都是基于WebKit内核开发的,所以我们可以通过PyQt中得QtWebKit把页面中的信息读取加载到HTML文档中,再解析HTML文档,从HTML文档中提取我们想用得信息。所需材料:作者本人实用MacOSX。应该在Windows和Linux平台也可以采用相同的法。1、Qt4libraryLibrary,而不是Creator。Library在Mac的默认安装路径下,应该是/home/username/Developor/,不要改变Qt4的默认安装路径。否则可能安装失败。官方网址:puting.co.uk/software/pyqt/download在终端切换到文件解压后的目录中。在终端中输入pythonconfigure.pymakesudomakeinstall进行安装编译。SIP和PyQt4两个安装方法相同。但是PyQt4依赖SIP。所以先安装SIP再安装PyQt41、2两步完成之后,Python的PyQt4的模块就安装好了。在Pythonshell中输入importPyQt4看看能不能找到PyQt4的模块。3、Spynnerspynner是一个QtWebKit的客户端,它可以模拟浏览器,完成加载页面、引发事件、填写表单等操作。这个模块可以在Python的官网找到。下载地址:python#-*-coding:utf-8-*-importspynnerbrowser=spynner.Browser()#创建一个浏览器对象browser.hide()#打开浏览器,并隐藏。browser.load("")#browser类中有一个类方法load,可以用webkit加载你想加载的页面信息。#load(是你想要加载的网址的字符串形式)printbrowser.html.encode("utf-8")#browser类中有一个成员是html,是页面进过处理后的源码的字符串.#将其转码为UTF-8编码open("Test.html",'w+').write(browser.html.encode("utf-8"))#你也可以将它写到文件中,用浏览器打开。browser.close()#关闭该浏览器通过这个程序,就可以比较容易的显示webkit处理的页面HTML源码了。spynner应用下面介绍一下spynner的简单应用,通过简单的程序,可以获取你在浏览器中看到的页面的全部图片。用HTMLParser、BeautifulSoup等都可以完成HTMLParser文档的解析。而我选择HTMParser。#!/usr/bin/pythonimportspynnerimportHTMLParserimportosimporturllibclassMyParser(HTMLParser.HTMLParser):defhandle_starttag(self,tag,attrs):iftag=='img':url=dict(attrs)['src']name=os.path.basename(dict(attrs)['src'])ifname.endswith('.jpg')orname.endswith('.png')orname.endswith('gif'):print"Download..",nameurllib.urlretrieve(url,name)if__name__=="__main__":browser=spynner.Browser()browser.show()browser.load("")Parser=MyParser()Parser.feed(browser.html)print"Done"browser.close()通过这个程序,可以下载你在页面上看到的全部图片。简单的几行程序就完成了这个艰巨的任务。实现了图片的批量处理。这真是Python语言的优势,再艰巨的任务交给第三方吧。

(web开发)用python创建一个最简单的网站?
答:本文,用python来创建一个最简单的网页。1先定义一个函数,用来向网站服务器发送请求:defyingyong(environ,start_response):start_response('200OK',[('Content-Type','text/html')])return[b'HowAre!']要求网站在网页上显示粗体的HowAre!2导入wsgi模块的子模块,用来创建服务器。fromwsgiref.simple_...

如何用Python开发一个简单的Webkit浏览器
答:1、Qt4libraryLibrary,而不是Creator。Library在Mac的默认安装路径下,应该是/home/username/Developor/,不要改变Qt4的默认安装路径。否则可能安装失败。官方网址:puting.co.uk/software/pyqt/download在终端切换到文件解压后的目录中。在终端中输入pythonconfigure.pymakesudomakeinstall进行安装编译。SIP和Py...

如何用python设计一个能实现添加、修改、删除、显示、退出等功能的小...
答:通过循环菜单的方式,让用户可以选择添加、修改、删除、显示、退出等功能。根据用户的选择执行相应的操作,例如添加数据就让用户输入键值对,修改数据就让用户选择要修改的键和新值,删除数据就让用户选择要删除的键,显示数据就输出整个字典,退出就结束程序。下面是一个简单的代码示例:data = {} # 创...

怎样用Python语言编一个小程序?
答:运行程序:可以使用 Python 解释器来运行 Python 程序。在终端或命令行界面输入 python 文件名.py 即可执行程序。下面是一个简单的示例程序:

怎样用Python写一个Html的简单网页
答:1、打开sublime text 3,新建一个PY文件。2、因为涉及到系统文件路径的原因,我们这里先导入系统模块。3、html = open("E:\\Download\\new\\new.html", "w")创建变量,然后设置文件名字,注意用w写方式来进行,这样就会创建一个新的HTML文件。4、html.write("<!DOCtype HTML>\ \n新的网页\\n...

如何用Python开发一个简单的Webkit浏览器
答:browser.load(QUrl(sys.argv[1]))browser.show()app.exec_()当你通过命令行将 url 传给脚本时,程序会加载 url 并且在窗口中显示加载完成的页面。现在,看似你已经有一个“命令行浏览器”啦!至少比 python 的 requests 模块强多了,甚至比 Lynx 还略高一筹,因为我们的浏览器还可以加载 ...

怎样用Python写一个简单的监控系统
答:首先我们设计一个web服务,实现如下功能:1. 完成监控页面展示 2. 接受POST提交上来的数据 3. 提供json数据GET接口 目录结构如下:web ├── flask_web.py └── templates └── mon.html flask_web.py import MySQLdb as mysql import json from flask import Flask, request, render...

如何用 Python 构建一个简单的分布式系统
答:上面讲的是从Python交互终端中调用add函数,如果我们要从另外一个py文件调用呢?除了通过import然后add.delay()这种方式,我们还可以通过send_task()这种方式,我们在项目根目录另外新建一个py文件叫做 excute_tasks.py,在其中写下如下的代码 from tasks import addif __name__== '__main__':add....

怎样用python实现这样一个简单程序
答:def numberInputer(prompt, quitflat): """ prompt: 输入时的提示信息, quitflag: 退出标识字 """ while True: gotter = rawinput(prompt+', "%s" for quit' % quitflag) if gotter==quitflag: break try: yield int(gotter) except: continuedegrees = ...

用python写一个单词推荐系统?
答:1. 准备单词列表和输入单词 首先准备一个单词列表,用于查找相似单词。然后输入用户要查询的单词。words = ['apple', 'banana', 'cherry', 'date', 'elderberry', 'fig', 'grape', 'honeydew', 'kiwi', 'lemon']query = input("Please enter a word: ")2. 计算单词间的相似度 可以使用...