电子词典中鼠标取词的原理

时间:2021-07-02 20:47:52
2000年11月27日 09:19:00


--
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 202.117.20.17]
发信人: Dreammy (George), 信区: Programming
标 题: Re: 谁知到电子词典中鼠标取词的原理?
发信站: BBS 水木清华站 (Thu Nov 6 17:51:06 1997)

【 在 dandan (dandan) 的大作中提到: 】
: 如题。
据我所知,解决方案一般有两种,都是针对如何知道当前屏幕任一坐标出的
字符的
1.采用截获对部分GDI的API调用来实现,如TextOut , DrawText , TextOutEx等,
字典对每次写屏操作进行跟踪.
技术细节就不赘述乐
这种方法也在一些中文系统如中文之星等中采用,另外,有些第三方的字体,
如ADobe等,也是这个方法(参阅>>Undocumented Windows<<(Andrew Schulman))
2.对每个设备上下文(DC)做一分Copy,并跟踪所有修改上下文(DC)的操作
这种方法更强大,但兼容性不好

实际上,无论那种方法,都有潜在的问题,如第一种方法,它在WIN95下
时仍是16位方式的(32位技术困难较大),这样就隐含了一个假定:所有
文本输出的32位API都要通过16位的DLL实现,在WIN95中的确如此,担高版本
就难说了
而且即使是第一种方法也容易带来兼容性的问题,比如博雅和中文之星2.0之间就有
一定的兼容性问题(WIN95下)




--
※ 修改:·Dreammy 於 Nov 6 17:57:23 修改本文·[FROM: 166.111.78.230]
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.78.230]
发信人: Gryphon (刘姥姥), 信区: Programming
标 题: Re: 谁知到电子词典中鼠标取词的原理?
发信站: BBS 水木清华站 (Thu Nov 6 21:33:32 1997)

【 在 dandan (dandan) 的大作中提到: 】
: 如题。

我是听过有人说,但不清楚。
具体的情况是:启动抓字程序的时候将GDI库中的TexOut截取出来。
当Mouse移动到那里后,就取到了。
我没做过,可能不正确

--
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.89.244]
发信人: lshi (海风), 信区: Programming
标 题: Re: 谁知到电子词典中鼠标取词的原理?
发信站: BBS 水木清华站 (Thu Nov 6 22:30:48 1997)

【 在 Gryphon (刘姥姥) 的大作中提到: 】
: 我是听过有人说,但不清楚。
: 具体的情况是:启动抓字程序的时候将GDI库中的TexOut截取出来。
: 当Mouse移动到那里后,就取到了。
: 我没做过,可能不正确

嘿嘿,你说的一点都没错。我最近正想做一个,不知能不能做出来。
--


雄关漫道真如铁
而今迈步从头越

..........好慢好慢啊,而今迈步从头爬

※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 202.112.145.96]
发信人: xiaobo (激情蕴于心中), 信区: Programming
标 题: 屏幕取词的方法
发信站: BBS 水木清华站 (Thu Nov 27 01:28:16 1997)

就是“金山词霸”、“博雅”这些词典都有的功能。

今天做了一个实验,终于大致明白它是怎么实现的。
实验很简单,自己写个程序,在OnPaint()里写一句MessageBeep(-1);
让PC喇叭发声。

然后运行这个程序和“金山词霸”(“博雅”也一样下面以“词霸”为例),
当鼠标在自己程序的窗口上停下一会儿(就是取词的等待时间)之后,PC喇叭就会发声,
同时鼠标也会闪一下。

这说明,鼠标停下之后窗口会重画,这必然是“金山词霸”引起的。
其目的是好让这个窗口产生API调用,以截取TextOut()、DrawText()等函数。
这样“词霸”就可以获取该窗口中输出的字符串了,然后再根据鼠标位置作
判断,就可以得到鼠标所指的字符(单词)了。

这些只是我的推断,不知是否正确,望高手指正。

另外,我还不明白的是该如何截取API调用呢?(这项技术很有用的。)
GetProcAddress()之后应该用自己的函数取代它,然后再调用原来的吧。
可是怎么实现呢?请指点一二。

--
江声浩荡,自屋后上升......

--《约翰.克利斯朵夫》

※ 修改:·xiaobo 於 Nov 27 08:05:21 修改本文·[FROM: 166.111.26.20]
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.26.20]
发信人: xyj (rocky), 信区: Programming
标 题: Re: 屏幕取词的方法
发信站: BBS 水木清华站 (Thu Nov 27 08:33:11 1997)

【 在 xiaobo (激情蕴于心中) 的大作中提到: 】
: 另外,我还不明白的是该如何截取API调用呢?(这项技术很有用的。)
: GetProcAddress()之后应该用自己的函数取代它,然后再调用原来的吧。
: 可是怎么实现呢?请指点一二。
可以看Matt Pietrek写的>Windows 95 System Programming SECRETS<
有中译本>Windows 95系统编程奥秘<
需要了解PE文件格式和系统可执行文件的加载方式!
偶认为象博雅这样的取词是通过截获系统DLL(可能是GDI)中的TextOut或其
相关函数来实现的.系统DLL内存地址<0X8000000(2G~4G),为所有
应用程序共享,地址空间固定,不象0~2G间的内存地址随不同的应用
程序而切换.

--
________________________
Rocky
To be, not to be!!!
^^^^^^^^^^^^^^^^^^^^^^^^

※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 203.93.44.131]
发信人: Hmmm (头大如斗然而非常高兴的Hmmm), 信区: Programming
标 题: Re: 屏幕取词的方法
发信站: BBS 水木清华站 (Thu Nov 27 09:04:34 1997)

【 在 xiaobo (激情蕴于心中) 的大作中提到: 】
: 就是“金山词霸”、“博雅”这些词典都有的功能。
: 今天做了一个实验,终于大致明白它是怎么实现的。
: 实验很简单,自己写个程序,在OnPaint()里写一句MessageBeep(-1);
: 让PC喇叭发声。
: 然后运行这个程序和“金山词霸”(“博雅”也一样下面以“词霸”为例),
: 当鼠标在自己程序的窗口上停下一会儿(就是取词的等待时间)之后,PC喇叭就会发声,
: 同时鼠标也会闪一下。
: 这说明,鼠标停下之后窗口会重画,这必然是“金山词霸”引起的。
: 其目的是好让这个窗口产生API调用,以截取TextOut()、DrawText()等函数。
: 这样“词霸”就可以获取该窗口中输出的字符串了,然后再根据鼠标位置作
: 判断,就可以得到鼠标所指的字符(单词)了。
: 这些只是我的推断,不知是否正确,望高手指正。
: 另外,我还不明白的是该如何截取API调用呢?(这项技术很有用的。)
: GetProcAddress()之后应该用自己的函数取代它,然后再调用原来的吧。
: 可是怎么实现呢?请指点一二。

用钩子函数应该就可以。
有一个叫socket spy的程序就是,做一个API的过滤器。
--
那天是你用一块红布
蒙住我双眼也蒙住了天
你问我看见了什么
我说我看见了幸福
...

※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: public.bjnet.ed]
发信人: xiaobo (激情蕴于心中), 信区: Programming
标 题: Re: 屏幕取词的方法
发信站: BBS 水木清华站 (Thu Nov 27 12:03:52 1997)

【 在 Hmmm (头大如斗然而非常高兴的Hmmm) 的大作中提到: 】
: 用钩子函数应该就可以。
: 有一个叫socket spy的程序就是,做一个API的过滤器。
钩子只能过滤消息吧,如何过滤API?
愿闻其详。

--
江声浩荡,自屋后上升......

--《约翰.克利斯朵夫》

※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.26.20]
发信人: ming (忙一阵子静一阵子), 信区: Programming
标 题: Re: 屏幕取词的方法
发信站: BBS 水木清华站 (Thu Nov 27 13:48:35 1997)

【 在 youxu (糖猪) 的大作中提到: 】
: 建议你去 曙光站 编程版看看,有一篇关于修改代码的文章.

我以前在网上取下来过两段代码,可能也是在曙光站看的, 记不清了。
是在win3.1/95以及NT下屏幕截取的例子。

ftp://166.111.79.141/Internet/Program/guihook.zip & guihooknt.zip

--
圣人忘情
最下不及情
情之所钟
正在我辈

※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.79.141]
发信人: poncaly (庞卡莱VS机器猫), 信区: Programming
标 题: Re: 屏幕取词的方法
发信站: BBS 水木清华站 (Fri Nov 28 14:15:08 1997)

【 在 xiaobo (激情蕴于心中) 的大作中提到: 】
: 钩子只能过滤消息吧,如何过滤API?
: 愿闻其详。

过滤API函数有三种方法。
1 做一个DLLLL,在内部实现与被调用APAPI同名的函数,再把这个DDDLL放到系统DDDLL?nbsp;
前面
2 修改AAAPI函数代码,设置断点或用JJJMMMPPP,CCCALLL指令。
3 在其他的进程中注入DDDLLLLL,有四种方法
1 设置钩子函数
2在注册表中进行注册
在 中用CCCC函数,不过不适合9595
强行注入D,

--
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.5.122]
发信人: Dreammy (这个杀手不太冷), 信区: Programming
标 题: Re: 屏幕取词的方法
发信站: BBS 水木清华站 (Sat Nov 29 13:47:29 1997)

【 在 xyj (rocky) 的大作中提到: 】
: 可以看Matt Pietrek写的>Windows 95 System Programming SECRETS<
: 有中译本>Windows 95系统编程奥秘<
: 需要了解PE文件格式和系统可执行文件的加载方式!
: 偶认为象博雅这样的取词是通过截获系统DLL(可能是GDI)中的TextOut或其
: 相关函数来实现的.系统DLL内存地址<0X8000000(2G~4G),为所有
: 应用程序共享,地址空间固定,不象0~2G间的内存地址随不同的应用
: 程序而切换.
这倒没有太大必要,因为博雅或其他字典都是16位的,做起来简单多了
它们是NE(New Executable) , 离Portable .... 还有点距离
弟做过一个通用的API钩子模块, 主要的问题没出在这,倒是处理重入(Reentry)
的问题费了好大力气,还有,它们兼容性不好(如博雅,和CStar),这在我前面的
一片RE里讨论过


--
※ 修改:·Dreammy 於 Nov 29 14:06:36 修改本文·[FROM: 166.111.91.63]
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.91.63]
发信人: xyj (rocky), 信区: Programming
标 题: Re: 屏幕取词的方法
发信站: BBS 水木清华站 (Mon Dec 1 10:13:39 1997)

: : 偶认为象博雅这样的取词是通过截获系统DLL(可能是GDI)中的TextOut或其
: : 相关函数来实现的.系统DLL内存地址<0X8000000(2G~4G),为所有
: : 应用程序共享,地址空间固定,不象0~2G间的内存地址随不同的应用
: : 程序而切换.
: 这倒没有太大必要,因为博雅或其他字典都是16位的,做起来简单多了
: 它们是NE(New Executable) , 离Portable .... 还有点距离
: 弟做过一个通用的API钩子模块, 主要的问题没出在这,倒是处理重入(Reentry)
: 的问题费了好大力气,还有,它们兼容性不好(如博雅,和CStar),这在我前面的
: 一片RE里讨论过
:
Sorry,前一篇没有说清楚!
Win95下的GDI的核心代码是16位的,GDI32只是GDI16的一个外壳,
所有象跛鸭之类的16位字典可以运行.
由于GDI32处理了重入问题,因此在HOOK了GDI16的函数时,运行32位程序
应该没有重入问题,但16位的恐怕就有些问题!



Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=3160