ip地址查询python3小工具_V0.0.1

时间:2023-03-09 06:19:40
ip地址查询python3小工具_V0.0.1

看到同事在一个一个IP地址的百度来确认导出表格中的ip地址所对应的现实世界的地址是否正确,决定给自己新开一个坑。做一个查询ip“地址”的python小工具,读取Excel表格,在表格中的后续列输出尽可能多的ip地址查询平台的结果以供验证比对。
第一个版本写的比较丑,仅仅能用,后续慢慢完善吧。

 # -*- coding: utf-8 -*-
# @Author: EnderZhou
# @E-mail: zptxwd@gmail.com
# @Date: 2018-11-09 15:17:21
# @Last Modified by: EnderZhou
# @Last Modified time: 2018-11-09 16:56:40 import sys
import requests #读取web页面
import openpyxl #读写Excel
import re #正则表达式
import time #延时 后期将尝试使用多线程和随机延迟、代理地址池等手段提高速度、降低搜索被禁风险。 def get_ip(text): #后续使用正则表达式判断是否是ip地址
#默认网页内的IP地址位于端口号之前,并且中间至少隔了一个非数字的字符串
# (?:((?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\2}|2[0-5][0-5])) 用于匹配IP地址
# (6[0-5]{2}[0-3][0-5]|[1-5]\d{4}|[1-9]\d{1,3}|[0-9]) 用于匹配端口号 注意端口号匹配规则应从大到校排序
# 使用 ([0-9]|[1-9]\d{1,3}|[1-5]\d{4}|6[0-5]{2}[0-3][0-5]) 替换即可观察到原因。
# 使用\D+?匹配IP地址与端口号中间至少隔了一个非数字的字符串
p = r'(?:((?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\2}|2[0-5][0-5]))'
iplist = re.findall(p,text)
for each in iplist:
print(each) proxies = {
"http":"http://127.0.0.1:8080",
"https":"https://127.0.0.1:8080"
} headers = {
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:63.0) Gecko/20100101 Firefox/63.0',
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
'Accept-Encoding':'gzip, deflate',
'Referer':'http://101.71.29.5:10023/',
'Content-Type':'application/x-www-form-urlencoded',
} ipsearchurl = 'http://www.ip168.com/chxip/doGetIp.do' def get_add(ipadd):
payload = {}
payload['keyword'] = ipadd
payload['btnsearch'] = '%E6%9F%A5%E8%AF%A2'
r = requests.post(ipsearchurl,timeout=10,data=payload,proxies=proxies,verify=False,headers=headers)
# print(r.status_code)
print(r.text[7:])
return r.text[7:] wb = openpyxl.load_workbook('非内陆IP攻击统计.xlsx')
# 获得所有sheet的名称
print(wb.get_sheet_names())
# 根据sheet名字获得sheet
a_sheet = wb.get_sheet_by_name('Sheet1')
# 获得sheet名
print(a_sheet.title)
# 获得当前正在显示的sheet, 也可以用wb.get_active_sheet()
sheet = wb.active # 获得最大行
row_num = sheet.max_row
print(row_num) for i in range(2,row_num) :
ipadd = sheet['B'+str(i)].value
print (ipadd)
# get_ip(ipadd) 这里缺少一个判断单元格内容是否为正确的IP地址格式的函数,后续会利用以前写的IPv4地址正则来实现。
add = get_add(ipadd)
sheet['E'+str(i)] = add
wb.save('非内陆IP攻击统计_test.xlsx')
time.sleep(10)

ip地址查询python3小工具_V0.0.1