今天是小编分享python入门教程第七讲,讲述关于python的字符串与令人头疼的
字符编码,彻底搞懂字符编码二,decode()与encode()两个方式的利用。
13入门系列教程七彻底搞懂字符编码一
东西/原料
- python
方式/步调
- 1
chardet模块功能:可以检拆字符串编码,查抄是否有该模块,报错信息提醒没有该模块
- 2
若是没有该chardet模块的可以用pip install chardet安装
以下是安装环境
- 3
这两个decode()、encode()
decode()功能:将其他编码字符转化为Unicode编码字符。 encode()功能:将Unicode编码字符转化为其他编码字符。
- 4
其实乱码素质上就是当前系统编码与所供给的字符编码纷歧致导致的。接下来举一个用的比力的多的例子
在windows系统下利用python2获取百度首页的title
- 5
首页利用的字符编码是utf-8,而我们当前windows系统的默认字符编码是gbk,我们来测试一下直接提取会不会呈现乱码问题。
import re,urllib2
html = urllib2.urlopen('http://www.baidu.com/').read()
title = re.findall(r'<title>(.*?)</title>',html)[0]
- 6
怎么解决乱码呢?
gbk_title = title.decode('utf-8').encode('gbk')
注重事项
- 分享投票点赞或存眷,是对小编最年夜的鼓动勉励。感谢~
来源:百闻(微信/QQ号:9397569),转载请保留出处和链接!
本文链接:https://www.ibaiwen.com/web/242783.html
- 上一篇: 【区块链】百度钱包怎么免费领取区块链莱茨狗
- 下一篇: 自制wifi信号放大器
- 热门文章
-
WB蒙特利尔(WB Montreal)——欧美十大最差视频游戏开发商
迅猛龙(Velociraptor)——欧美史前十大死亡动物
什么是果酱猫(What Marmalade Cats)?
神奇蜘蛛侠2(The Amazing Spider-Man 2)——欧美最佳蜘蛛侠电影
希瑟(Heather)——欧美十大最佳柯南灰歌
二人梭哈
faceu激萌怎么把瘦脸开到最大
奥兹奥斯本(Ozzy Osbourne)——欧美十大高估歌手
什么是小脑前下动脉(Anterior Inferior Cerebellar Artery)?
我应该知道康涅狄格州的什么(What Should I Know About Connecticut)?
- 热评文章
- 最新评论
-
- 最近访客
-
- 站点信息
-
- 文章总数:200248
- 页面总数:9
- 分类总数:1
- 标签总数:0
- 评论总数:0
- 浏览总数:497