python学习进阶正则,python正则教程

大家好，今天小编关注到一个比较有意思的话题，就是关于python 学习进阶正则的问题，于是小编就整理了3个相关介绍 Python学习进阶正则的解答，让我们一起看看吧。

python中特殊字符的替换？
python怎样用正则表达式匹配不包含某些字符的字符串？
学习python爬虫对python要掌握到什么程度才可以学python爬虫？

python***殊字符的替换？

1、用字符串本身的replace方法

复制代码代码如下:

（图片来源网络，侵删）

a.replace('word','python')

输出的结果是hello python

2、用正则表达式来完成替换:

（图片来源网络，侵删）

***代码代码如下:

import re

strinfo = re***pile('word')

（图片来源网络，侵删）

b = strinfo.sub('python',a)

print b

python怎样用正则表达式匹配不包含某些字符的字符串？

这样写就行

关键是这个‘^’。另外'(', ')'是正则表达式里边的特殊字符，需要'\(' , '\)'转译一下。

还有一点，你问题里边的‘（’‘）’是中文的全角字符。如果你要匹配它们，还得加编码哦。

学习python爬虫对python要掌握到什么程度才可以学python爬虫？

如果你python一点基础都没有，那么《简明python教程》《廖雪峰的python教程》《Python 3 菜鸟教程》你应该学学。这三个教程随意选择其中一个都可以。

然后，以爬虫作为python入门练手，是不二之选。许许多多公司的入职培训都是爬虫。

爬虫需要许多非python的知识，以下简单列出来：***协议，正则表达式/lxml/beautifulSoup，mysql/sqlserver/redis/mongo等某个或某几个数据的知识，多线程，scrapy框架，scrapy-redis分布式爬虫组件，bloomfilter去重算法，***代理，phantomjs。这些知识可以边做边学。

以初学python的我举例：

简单的爬虫，只需要会使用urllib，urllib2，re，requests模块就可以爬一些简单的网站数据了。如果想要把数据保存，可能需要xlwt用来操作 excel的库。除了python上述库的使用，也需要python基础知识，例如字典，list，循环语句，函数def等

简单的爬虫除了python基础外，还需要web一些知识，get和post请求方式，简单说就是会分析网站

如果想要爬取大量数据，复杂网站的话，需要学习多线程，框架，反爬等技术，希望早早进入爬虫界，咱们一起加油

当然是能用的程度呗，今天我学会了用一个第三方包，那么我明天也会用另一个，py本身是胶水，沾沾就行了。如果你想设计大型系统，提供和接口给别人用，那么要学的东西可就多了，而且需要本身的知识肯定不够

学好python基础语法，正则表达式；再学习urllib、requests、beautifulsoup库等，了解web前端；在此基础之上找些案例尝试自己写简单爬虫，从中找到问题再继续研究。高级爬虫涉及到进程与线程、IO编程、网络编程等技术，需要深入学习。

事实上要看你需要在爬虫上做的多深入了，如果要爬取一个简易的页面，没有认证交互，没有session限制等等，你可能只需要学习基本的正则表达式，urllib的用法。若你需要爬取一些安全措施更高的页面，可能需要熟悉web前端的知识，以及session，cookie的机制，另外如果页面有身份认证等，你还需要学习一些md5，base64等加密算法的使用。再次如果你不光对爬取有要求，还想要把自己的爬取脚本模板化或者规范化，你可能最终还是会走上使用scrapy的道路。

到此，以上就是小编对于python学习进阶正则的问题就介绍到这了，希望介绍关于python学习进阶正则的3点解答对大家有用。

正文

python学习进阶正则,python正则教程

python***殊字符的替换？

python怎样用正则表达式匹配不包含某些字符的字符串？

学习python爬虫对python要掌握到什么程度才可以学python爬虫？

相关阅读

python机器学习手册,python 机器学习

应该怎么学习python,怎么学好python

python新手怎么学习,python新手教学

python类的学习,python类详解

目录[+]