Tag Archives: Python

基于GAE的新浪微博 QQ空间 豆瓣 OAuth2.0 认证(待续)

附:OAuth2.0通用函数

基于GAE的OAuth2.0授权模块

Google App Engine 平台上OAuth2.0的Python实现。

与普通http请求授权不同,GAE平台上使用urlfetch作为http请求的封装,其他基本上相同。

新浪微博、腾讯Qzone、豆瓣网OAuth2.0 示例

 

Python 网页解析笔记(一)

语言版本:Python 2.7

函数库:urllib2、chardet、BeautifulSoup

示例代码如下:

————————

chardet是一个自动检测网页编码的函数,调用detect会返回一个字典:

{‘confidence’: 0.99, ‘encoding’: ‘utf-8’}

confidence是检测的正确率,encoding是网页编码的代码

—————————

在BeautifulSoup4之后构造函数的fromEncoding参数改为from_encoding,当然用前者也可以,只是出现警告而已。

—————————

在Python内部都是按照unicode来编码的,所以在获取一个非unicode编码的网页时首先要将编码转换如decode(‘gbk’),是将GBK转换为UTF-8编码。

—————————-

Windows CMD下需要将代码页改为65001才支持UTF-8。但是在使用BeautifulSoup的时候在命令行回显时会出现IOError,但在Python IDE下没有问题。