小技能GET:管理域名解析时各个资源记录类型
部署网站的事情嘛..平时也就部署那几次然后能用很久,时间长又得回去查询各种域名解析记录是代表什么意思。为了方便干脆自己做一个简单总结。
运行环境 Runtime environment1操作系统: win10
Manage DNS许多域名接入商都有提供自己的域名解析服务,这里以nameSilo为例:上面 A | AAAA | CNAME | MX | TXT/SPF | SRV | CAA 等记录类型
123456CNAME: 解析到网址。A: 解析到ipv4 ip地址。AAAA: 解析到ipv6 ip地址。MX: MX记录就是邮件交换记录,是域名在DNS服务器上的一个记录,告诉那台计算机负责为系统处理邮件。TXT/SPF: 对发送邮件者的 IP 地址来进行简单的邮件验证的系统,域名的管理员通过 SPF 记录或 TXT 记录来规定这个域名下哪些 IP 地址是「允许」发送邮件的。SRV: 用来指定服务地址。与常见的A记录、cname不同的是,SRV中除了记录服务器的地址,还记录了服务的端口,并且可以设 ...
小技能GET:记初次折腾ipv6
自从换了笔记本,旧的笔记本旧限制了一两年。 早前有打算用它做服务器,发挥一下余热。如今实施起来的第一步就困难重重。
运行环境 Runtime environment1操作系统: win11
背景想将一台限制的笔记本作为服务器,并且能够通过公网访问上面的服务。我是2020年办理的联通宽带,给来的光猫也是到现在2024年怎么说也是颇有年头了。由于众所周知的原因,现在家庭宽带,是没有公网IPV4的,申请手续和收费也劝退。了解到可以使用ipv6来做公网NAS服务的先例,所以就想着是否可以通过它来达到我的目的。
网络环境测试首先,使用在线工具测试。测试是否支持ipv6
https://www.test-ipv6.com/
哦吼,好像不行。可以看到至少服务商本身是支持ipv6的,那可能就是光猫和路由器这层没有开启ipv6.
光猫设置我使用的是联通沃wo的吉比特啥啥生产的光猫。光猫内置的系统是wo-27s。调整光猫支持ipv6需要使用光猫的管理员权限。
http:192.168.1.1/cu.html
使用默认登录账号密码即可,我这是广州的联通,各个地区可能不一样。为了能查到这个账 ...
随笔:apiherobuy项目总结
因为新冠肺炎的关系,我所在的公司面临业务转型,所以在电商采集这一块,可能就终止了。http://api.herobuy.com/ 接口项目就做个总结,留个念想。
背景apiHerobuy项目是用于公司做逆向海淘(海外代购国内商品)业务,主要是通过实时解析国内多个大型电商的商品信息,
让海外的用户轻松购买国内的(淘宝、天猫、京东、1688等等的电商大头)商品。
但是由于最近的海外 新冠肺炎(英文︰COVID-19)疫情严重,海外的用户购买力下降,加上进出口限制更加严格等问题,
导致这方面的业务已经开展不下去了,于是公司代购业务面临转型,而该解析项目也就终止了。
于是,就这个项目做一些总结。毕竟,都是我一个人去完成的,就像自己的孩子一样..挺可惜的
项目展示扉页
登录
注册
信息总览
菜单总览
爬虫运行管理
爬虫封装&部署
cookies池,账户信息管理
技术栈包含但不限于以下技术栈..太多琐碎的了,就列举几个比较大的。
Django
Redis
Mongodb
Scrapy
Scrapy-redis
Scrapyd
Docker
uwsgi
Nginx
Boostra ...
疑难杂症:pip安装uwsgi报错
最近在做网站迁移,使用新服务器安装虚拟环境的时候,安装uwsgi报错了。
运行环境 Runtime environment1234操作系统 : Ubuntu18.04 IDE: JetBrains Pycharm 2018.2.4 x64 Python: 3.6.9Django: 3.0.5
症状最近在做网站迁移,使用新服务器安装虚拟环境的时候,uwsgi报错了。使用的是virtualenvwrapper + virtualenv来管理虚拟环境在虚拟环境中pip安装requirements.txt安装不上uwsgi
解决办法退出当前虚拟环境检查服务器主环境是否安装了pip3
sudo apt-get install python3-pip
再次尝试是否可以安装。
如果还是不可以,就需要检查有关的安装依赖是否齐全
虚拟环境下的pip是否为最近版本
python-devel libevent-devel libjpeg-devel 等等安装依赖是否齐全
python 指向的是什么python版本
Web后端:Django的models里的objects使用时出现黄色警告
开发的时候,用django ORM创建好模组model,在视图调用查询的时候,会发现objects报黄。强迫症就无法忍受这样东西了,所以要怎么解决呢?
运行环境 Runtime environment123操作系统 : Ubuntu18.04IDE: JetBrains pycharm 2019.2.4 x64Python: 3.6.9
objects 概念12345678910首先我们先熟悉下objects的大致概念.object是模型属性---用于模型对象和数据库交互 .objects = Manager() 是管理器类型的对象 ,是Model和数据库进行查询的接口.objects : 管理器对象是Manager类型的对象,定义在from django.db import models中用于模型对象和数据库交互是默认自动生成的属性,但是可以自定义管理器对象
症状123456789101112models.py 文件中class Students(models.Model): name = models.CharField(max_length=20) gen ...
Python:标准库--IO流
IO也算是python标准库比较常见的了。平时光用,但没有好好的去理解它。
运行环境 Runtime environment123操作系统: Windos10 IDE: JetBrains Pycharm 2019.2.4 x64 语言: Python 3.7.4
io流(io stream)1234567891011 流是一种抽象概念,它代表了数据的无结构化传递。 按照流的方式进行输入输出,数据被当成无结构的字节序或字符序列。从流中取得数据的操作称为提取操作,而向流中添加数据的操作称为插入操作。用来进行输入输出操作的流就称为IO流。换句话说,IO流就是以流的方式进行输入输出。 输入输出(IO)是指计算机同任何外部设备之间的数据传递。常见的输入输出设备有文件、键盘、打印机、屏幕等。数据可以按记录(或称数据块)的方式传递,也可以流的方式传递。所谓记录,是指有着内部结构的数据块。记录内部除了有需要处理的实际数据之外,还可能包含附加信息,这些附加信息通常是对本记录数据的描述。
StringIO很多时候,数据读写不一定是文件,也可以在内存中读写。
StringIO顾 ...
Python:字符串前面加f是什么意思呢?
python字符串前面加f是怎么回事呢?python相信大家都很熟悉,但是python字符串前面加f是怎么回事呢,下面就让小编带大家一起了解吧。 python字符串前面加f,其实就是是什么意思,大家可能会很惊讶python怎么会字符串前面加f呢?但事实就是这样,小编也感到非常惊讶。 这就是关于python字符串前面加f的事情了,大家有什么想法呢,欢迎在评论区告诉小编一起讨论哦!
运行环境 Runtime environment123操作系统: Windos10 IDE: JetBrains Pycharm 2019.2.4 x64 语言: Python 3.7.4
描述格式化字符串常量(formatted string literals),是Python3.6新引入的一种字符串格式化方法,该方法源于PEP 498 – Literal String Interpolation,主要目的是使格式化字符串的操作更加简便。f-string在形式上是以 f 或 F 修饰符引领的字符串(f’xxx’ 或 F’xxx’),以大括号 {} 标明被替换的字段;f-string在本质上 ...
Python爬虫:如何解决python执行js的bug
爬虫最烦的就是搞逆向,而逆向其实本身完全可以成为另外一种职业了。做爬虫什么的,太累了。解决pyv8和pyexectjs 出现bug的问题。
运行环境 Runtime environment123操作系统: Windos10 IDE: JetBrains Pycharm 2019.2.4 x64 语言: Python 3.7.4
背景为了吃饭。用文书网做个简单举例。博文主要不是说如何逆向爬取的问题,而是说在python执行JS时出现的问题有什么解决办法。
简单说明
首先,找入口
很容易就找到函数位置
复制出来,console执行一波
开始搞js(哪个报错找哪个)可以看出,random没定义,要去找random,修复到堪用就可以
一顿操作猛如虎,放到python里面执行解密完发现,还有令人眼熟的CryptoJS这个百度下,是js的一个加密库
nodeJS执行在python的JS执行环境里装一下CryptoJS这个包即可然后导入
或用pyv8等等库去调用CryptoJS源码来使用就像这样,就懒得写那么细了大概意思。
运行一段时间,你会发现机器cpu100 ...
Python爬虫:记录一次字体反爬的过程
近期实践对中国供应商网的字体反爬进行一次练习,并写博文作为记录
运行环境 Runtime environment123操作系统: Windos10 IDE: JetBrains Pycharm 2019.2.4 x64 语言: Python 3.7.4
背景为了吃饭。
目标从中国供应商网上,将公开的电话号码采集下来
https://ph0101.cn.china.cn/contact-information/
目标网站HTML考虑到网站可能会改版,导致博文例子失效,所以把当时网站前端HTML单独保存下来,方便以后即使网站改版也能用旧的HTML来对比理解博文内容。
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510 ...
Python:正则表达式groups函数访问匹配串
Python 正则表达式RE模块里面的group方法用着挺方便的,在这里写博客做个简单的记录,方便日后查阅
运行环境 Runtime environment123操作系统: Windos10 IDE: JetBrains Pycharm 2019.2.4 x64 语言: Python 3.7.4
背景出于学习的目的,去尝试在中国供应商网练习字体反爬,过程中看到group的用法。
代码说明1234567891011121314import requestsimport base64import reurl = 'https://ph0101.cn.china.cn/contact-information/'res = requests.get(url).text# print(res)# 使用正则清洗出base64,并用group方法方便的从re.match对象中多个成立结果选取第一个。base64_group = re.search("base64,(.*?)'\)",res).group(1)base64_groups = r ...