为了自动能从群里采集数据,并提及到share.idoubi.net(全球资源逗分享)上,我用python写了爬虫,但是只从将wordpress更新自6.0版本后,在使用python登录wordpres时就报错:xml.parsers.expat.ExpatError: XML or text declaration not at start of entity
错误提示:
Tracebac.... Read More >
分类目录归档:Python
2021
11-19
11-19
Python:从数组中删除元素
1.删除第一个匹配数据:
>>> a = [0, 2, 3, 2]
>>> a.remove(2)
>>> a
[0, 3, 2]
2.根据index删除数据:
>>> a = [9, 8, 7, 6]
>>> del a[1]
>>> a
[9, 7, 6]
.... Read More >
2021
11-19
11-19
Python如何获取当前运行的文件名
Python有时候需要知道当前运行的py文件名,以下两行代码可以轻松获取当前文件名:
import os
#获取文件名(含后缀)
name=os.path.basename(__file__)
print(name)
#去掉文件后缀,只要文件名称
name=os.path.basename(__file__).split(".")[0]
print(name)
.... Read More >
2021
11-17
11-17
如何使用Python从字符串中提取URL
import re
def getUrl(string):
# findall() has been used
# with valid conditions for urls in string
regex = r"(?i)\b((?:https?://|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:.... Read More >

2021
11-08
11-08
Python 字母大小写的转换
2021
11-08
11-08
python中英文翻译translate模块使用
1.说明:
从一种语言到另一种语言的文本翻译在各种网站中越来越普遍。 帮助我们执行此操作的python包称为translate。
可以通过以下方式安装此软件包。 它提供主要语言的翻译。
官网链接:https://pypi.org/project/translate/
2.代码:
from translate import Translator
# 英语翻译中文
transla.... Read More >
在Python中调用以下代码时会返回错误:403 Forbidden
import requests
asset_url='http://www.idoubi.net/xxxx.html'
req=requests.get(url=asset_url)
之所以出现上面的异常,是因为如果用requests.get方式打开一个URL,服务器端只会收到一个单纯的对于该页面访问的请求,但是.... Read More >
2020
10-08
10-08
Selenium通过设置代理实现抓取HTTPS请求

今天学习selenium,执行时报错:This version of ChromeDriver only supports Chrome version 79
我先查看了chrome的版本,是81.0.4040
然后我在以下网站下载了版本最相近的驱动,就生效了
http://npm.taobao.org/mirrors/chromedriver.... Read More >