Python:使用urllib.parse操作和解析URL
URL就是个字符串,用正则处理是个不错的方案,但是urllib.parse使用起来可以更加简洁快速..
运行环境 Runtime environment
1 | 操作系统: Windos10 |
背景
爬虫里面要处理URL以便发出新的请求,web后端开发也要对URL处理类似跳转,入库等,总会用得着。
URL就是个字符串,用正则处理是个不错的方案,但是urllib.parse使用起来可以更加简洁快速..
快速的对URL拼接、拆分,组装,甚至判定URL是否合法等。
code
在输入的 URL 中如果有用户名和密码,
则可以用属性名 username 和 password 来获取它们,
如果没有,那么相应的属性的取值为 None 。
属性 hostname 的值与属性 netloc 的值相同,
只不过去掉了端口号,并且都是小写形式。
如果还有端口,
则属性 port 的值被转换为一个整数,
如果没有,属性的值就是 None 。
1 | from urllib.parse import urlparse |
打印结果:
1 | scheme : http |
总结
虽然说处理字符串方法真的很多,但是python 解析 url 的方法更加方便
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 快乐咸鱼のRaXianch窝!
评论
WalineValine