最近知识答题类的app应用和网站 都很火 所以机器人多了,,百度度秘、搜狗小汪等
Python发挥了很大作用
《百万英雄》《冲顶大会》《头脑王者》《一站到底》《芝士超人》《黄金十秒》《百万赢家》
大数据Hadoop,模拟器、OCR、搜索引擎+机器学习+python 一起可以破解上述答题PK赛https://www.appinn.com/millionheroassistant/
https://juejin.im/post/5a579d63f265da3e4d72a028
Python+第三方库(Cool)
“2018年才过一周,新风口已经出现。”——论学习的重要性。 好话不多扯,直接进入正题吧。
百万英雄答题,这个最近火的一塌糊涂的在线撒钱节目,已经…青小蛙都入坑答过题分到了 2 块钱。
然而 10 秒钟太短,有时候碰到一题卡住就欲哭无泪了。
不过,基于…哦不,基于现有网络技术条件,已经有开发者开发了答题助手放在 Github,今天就来看一下这个答题助手都能干什么。
注意,本文并不会教你怎么用,那是…开发者以及爱好者的事情,以及,这事就是图一乐,别太在意。
至于吐槽主持人的 ?
wenda-helper
https://github.com/rrdssfgcs/wenda-helper
副标题:响应最快支持多开的百万英雄//芝士超人/冲顶大会答题助手~
哈哈哈哈,这是一款利用手机模拟器+百度搜索+OCR 识别的组合工具,能够实现
“自动识别问题并且快速打开浏览器自动搜索答案的小程序”
结果是 5 秒钟之内获得答案,给你 5 秒钟选择正确答案。
问题出现时直接按 F2,浏览器就会自动被调用并且自动搜索识别出来的题目,马上浏览器中就会显示相关的搜索答案,基本第一二条搜索答案中就有题目答案。这个过程一般不超过 5s,然后从容答题搞定。
支持:百万英雄/知识超人/冲顶大会
MillionHeroAssistant
百万英雄答题助手
(汉王/百度OCR, 百度搜索/机器自动决策, Android / IOS手机均支持)
https://github.com/smileboywtu/MillionHeroAssistant
这个高级了,而且上面的 wenda-helper 也参考了 MillionHeroAssistant 的思路。
MillionHeroAssistant 的套路,哦思路是一样的,截取手机上的题目,通过 OCR 识别问题,使用百度知道搜索答案,根据前两个投票最高的答案,优先选择最佳答案。程序运行时间是 3 秒左右,有 7 秒的答题时间。
如果答案内容过长,使用文本摘要算法,显示最重要的 5 句。
以上两个开源项目,内部都有详细的使用介绍,在这里一两句也说不清楚,所以感兴趣的各位自行研究哈,青小蛙只能帮你到这了,嗯。
教你用python撸走《百万英雄》《冲顶大会》奖金。
百万英雄类答题游戏的程序员打开方式
最近这类答题app比较火,我的同事wangtonghe为开源社区贡献了他的python代码。以下文章为他的思路,我只做了部分整理发布于掘金社区,分享给大家。
- 起因
看了《程序员如何玩转《冲顶大会》?》大受启发,不过弱点很多,需要使用付费的OCR接口、再open到百度搜索答案,我们等待加载并且寻找答案的时候,已经错失了好的机会,刚好前几天研究了下微信跳一跳的辅助,正好可以用上。
-初步思路
思路很明确,把答案截图pull过来,通过PYTHON OCR 库进行识别成文字后再放到百度搜索。匹配出现率最频繁的词语,记过几番尝试后,一些容易搜索的问题还是是可以搜索大部分答案的。
- 尝试
目前它是手动的,也就是说每次答案出现,手动执行脚本返回答案。同样由于个别题目原因(如某个词有多少笔画)虽然不是百分之百的成功率,但是一般都能进入决赛+一张复活卡基本妥妥‘吃鸡’,下面是吃鸡截图:
- 技术栈
实现语言python,用到的类库如下:
- PIL
- pytesseract(图片识别库)
- BeautifulSoup(页面解析)
文字识别引擎需单独安装,参见Python人工智能之图片识别,Python3一行代码实现图片文字识别以及mac上文字识别 Tesseract-OCR for mac
主体代码如下:
import os
from PIL import Image
import pytesseract
from urllib.request import urlopen
import urllib.request
from bs4 import BeautifulSoup
DEFAULT_WIDTH = 720
DEFAULT_HEIGHT = 1280
def main():
# 720*1280分辨率坐标
left_top_x = 30
left_top_y = 200
right_bottom_x = 680
right_bottom_y = 380
# 1. 截图
os.system('adb shell screencap -p /sdcard/answer.png')
os.system('adb pull /sdcard/answer.png answer.png')
# 2. 截取题目并文字识别
image = Image.open('answer.png')
crop_img = image.crop((left_top_x, left_top_y, right_bottom_x, right_bottom_y))
crop_img.save('crop.png')
text = pytesseract.image_to_string(crop_img, lang='chi_sim')
print(text)
# 3. 去百度知道搜索
text = text[2:] # 把题号去掉
# text = '一亩地大约是多少平米'
wd = urllib.request.quote(text)
url = 'https://zhidao.baidu.com/search?ct=17&pn=0&tn=ikaslist&rn=10&fr=wwwt&word={}'.format(
wd)
print(url)
result = urlopen(url)
body = BeautifulSoup(result.read(), 'html5lib')
good_result_div = body.find(class_='list-header').find('dd')
second_result_div = body.find(class_='list-inner').find(class_='list')
if good_result_div is not None:
good_result = good_result_div.get_text()
print(good_result.strip())
if second_result_div is not None:
second_result = second_result_div.find('dl').find('dd').get_text()
print(second_result.strip())
if __name__ == '__main__':
main()
文字识别需经训练,训练越多结果越准。
我把代码放到github上了,可围观hq-answer-assist
- 结语
要想实现更智能化,有个思路是不停的截图(1秒一次),一旦截到答题页(可以用答题页的色差来做),做文字识别后百度,将百度后的结果与选项做比较,哪个出现次数最多哪个就是最佳答案,这里可以加个判断,如果特别确定直接模拟点击事件选答案,不确定就手工。
有同学提到分析请求,也是个思路,后续可以研究。
欢迎探讨其他更好的实现方式。
“2018年才过一周,新风口已经出现。”
“新风口”说的是直播答题。
1月3日,王思聪宣布拿出10万元给一款名为“冲顶大会”的App当作奖金,并附上自己在“冲顶大会”App中赢得322.58元奖金的截图。
随着王思聪一条博文的呈现,以“冲顶大会”为首的知识竞赛类直播成为新风口。随后,“芝士超人”“百万英雄”“百万赢家”等纷纷跟进,前后不过10天的时间。
除了直播答题单场资金从最初的1万元飙升至200万元,总奖金数额也连破纪录,并于1月8日达到顶峰:周鸿祎直接宣布“百万赢家”将把场次增加至7场,投放奖金提高至530万元。
从出现到引爆仅仅半个月时间,直播答题赢奖金的模式迅速进入百万级——单场在线人数破百万、奖金额度破百万。各大平台纷纷入场,用提升奖金额度、拉明星助战等方式争夺用户。不过,《法制日报》记者调查发现,这个竞赛也开始变得不公平起来,利用外挂作弊已经出现。
参与者吐槽“题太难”
直播答题为什么会火?高额奖金、超低的参与门槛、邀请好友获得复活卡的病毒式传播、难度系数低、一天多次的游戏时间……新玩法引发极高参与性。看微信朋友圈里的各种晒图,有的全家上阵,有的三五好友组团出击。
1月7日晚,北京市民陈女士与家人紧盯着手机屏幕,玩一款实时直播答题游戏。屏幕上跳动的数字显示,在线答题的网友人数已经超过了100万。
“这场奖金是100万元,全答对就能分钱。”陈女士告诉记者,她下载了3个答题平台,从晚上7点开始,几乎每半小时就要“赶一次场”。
各大直播答题平台的玩法基本一样,由主持人出题,网友在线回答,每场共12道选择题,在指定时间内全答对的人可以瓜分奖金。
3天时间,陈女士在某答题平台已经通关4次,共获得34元的奖励。
随着直播答题的流行,在微信朋友圈晒战绩、分享邀请码的人越来越多。根据规则,分享邀请码可以获得复活卡,答错后使用复活卡能有一次继续答题的机会。同时,搜集和分享题库、抱团答题的线上社团也随之而生。
百万奖金看起来十分诱人,但问题是,真能凭此赚到“大钱”吗?
选个题目看一下:“《汉谟拉比法典》颁布的时间与下面的哪个历史事件在时间上最接近”,需要在几秒钟内迅速做答。
由于题目太难,有人质疑“奖金是内定的”。不过,多数情况下各大平台的题目并不是很难,一般维持在每人分几元的水平。
从排行榜来看,截至1月8日16时,“冲顶大会”总榜第一名有5132.57元,“芝士超人”第一名3681元,“百万英雄”第一名4万元。
“这几天答题分钱的综艺游戏火了,各家我都玩过。平时‘百万英雄’的题目都很简单,一场下来很多人都能通关,每个人分几元钱。结果有一场的难度突然提高,最后只剩下23个人通关,分100万元奖金,每个人分了4.3万元。之后,就有很多人在吐槽‘百万英雄’这种难题模式。”在北京一所高校就读的陈雪枫向记者吐槽说。
“辅助工具”应有尽有
为了能够全部答对12道题,平分数额庞大的奖金,参赛者开始想方设法提高自己答题的正确率。
正如相关直播主持人介绍的一样,许多答题者开始寻找身边的朋友共同答题,以求覆盖到更多类型的知识点,提高通关的几率。
记者加入一个名为“百万英雄答题”的微信群,群内成员会在答题时分享自己认为正确的答案。通过这种微信群,记者答题的准确率有了显著提升。群内也经常有成员公布自己获得奖金的截图。
不过,也有一些答题者再一次利用了科技的力量。比如程序员杨松(化名)。杨松曾像多数人一样,尝试通过百度搜索来获得题目的正确答案,但他发现这个过程消耗的时间远远超出答题时间(一般不超过10秒——记者注)。于是,他花了3个小时用Python(编程语言)写了一款能够在网站上自动检索答题信息的程序。
杨松说,他设计的程序能将准确率提升到90%。程序可以识别图片中的文字内容(问题和选项),然后通过百度进行搜索关键字出现的次数,最后将统计的信息展示出来。“你只要有一张复活卡,基本就能通关。”杨松说,“游戏也从知识问答变成了手速游戏。”目前,两轮测试帮助他获得了超过20元的奖金。
此外,记者在电商平台上同样搜索到了出售类似辅助工具的店家,但相关店面并不多。根据店家介绍,这款辅助App可以自动识别语音,帮助买家自动搜索相关信息、节约时间,买家需要下载后才能使用。搜索“百万英雄”也发现了不少干货:只卖9.9元的通关秘笈;1元钱一张的复活卡,买五送一;15元钱的答题辅助工具等,应有尽有。
同时,电商平台上还有关于“冲顶大会”的不同外挂方式。记者在一些电商平台的搜索框中输入“冲顶大会”字眼,很快便出现不少搜索结果,其中有“冲顶大会”的电子版题库,但更多的是卖额外邀请复活机会的卖家。记者随机点进一家店铺,向客服询问辅助的事情,客服表示他们提供的服务是增加生命值,客户拍下商品之后,备注自己游戏的邀请码,店家会输入。相当于客户邀请了新的好友,就可以多一次复活机会。一次只需要2.5元,并且可以多次购买。
“辅助软件”免费升级
在QQ群中搜索“冲顶大会”,结果出现大量以“辅助”“咨询”“互助”为名称的聊天群。记者随机申请加入一个“辅助群”,很快便被通过了。记者询问群管理员可以提供怎样的辅助,对方很热情地介绍说,他们的软件可以帮助客户答3道题,“你有不会回答的时候或者没回答上来,软件可以自动帮你选择,7秒钟就可以分析出答案”,并表示他们是全网唯一一款辅助软件。当谈到购买方式时,对方表示,这个软件一次性付款50元,购买完成就可以永久使用。付款之后,他们会发给客户一个代码,在玩游戏答题的时候,打开辅助代码就行了。
客服进一步介绍说,他们的软件目前只能帮忙回答3道题,不过他们也在不断升级换代。如果以后可以有更高的答题率,他们会保证老客户免费升级,不会再收额外的费用。
记者询问购买的人多不多,客服表示,软件现在还处于推广过程中,知道的人还不是很多。客服还很爽快地说,如果记者能拉来两个客户,就能免费赠送一个软件。介绍的人越多就越便宜。
这种“辅助工具”算不算作弊的外挂呢?杨松认为,这款软件顶多算辅助工具,而非外挂。
不过,记者查询发现,“百万英雄”的活动规则明确写出,“禁止用户以任何不正当手段及舞弊行为参与本活动”,一经发现则取消参与及获奖资格。这些行为包括但不限于使用“模拟器、插件外挂等非法工具下载、注册、答题等”。
对此,北京律师岳屾山认为,这种线下作弊情况很难查处。软件方很难判断答题者是真的“知识”丰富,还是使用了辅助工具。