Unicode 控制字符 - wpjamer

时间:2024-03-05 10:41:04

Unicode 控制字符

什么是Unicode字符,有兴趣却还不知道的可以搜索一下,网上很多。

Unicode控制字符就是特殊的Unicode字符

 

逐个查的一些控制字符在百度贴吧的转义代码对照表
Unicode-控制字符
‎LRM‎ 从左到右标记
‏RLM 从右向左标记
‍ZWJ‍ 零宽度连接器
‌ZWNJ‌零宽度非连接器
‪LRE‪ 开始从左到右嵌入
‫RLE‫ 开始从右向左嵌入
‭LRO‭ 开始从左向右覆盖
&#823X;RLO开始从右向左覆盖 X=8(就是”&#”加上”8238″,以下还会出现)
&#823Y;PDF结束方向格式 Y=6(就是”&#”加上”8236″)

以下见附录1:
NADS
NODS
ASS
ISS
AAFS
IAFS
RS 记录分隔符(块分隔符)
US 单元分隔符(段分隔符)

当然,也可以用16进制表示,如让文本实现反向排列的RLO对应的&#823X;等同于&#x2O2E;
让前面运算法则结束的字符PDF是&#823Y;等于&#x2O2C;(此处X=8,Y=6,O=0,下同)

例如,“鸟巢设计”在百度贴吧是打不出来的,但反过来的“计设巢鸟”可发出来
那么你发表《&#823X;计设巢鸟》,然后别人看到的就是《鸟巢设计》了
如果禁用词后面还有很多正常的词语这样不就太麻烦了吗?你用&#823Y;结束命令即可
例如 你发表《我想问下&#823X;计设巢鸟&#823Y;这四个字为什么被屏蔽》
效果就是   《我想问下鸟巢设计这四个字为什么被屏蔽》
明白了吗?(此处X=8,Y=6)

 

更新1:贴吧改版了,不能转义了,但是你可以在记事本里输入好,也可以先在老版本贴吧发出来,然后复制到新版贴吧发出。有点麻烦。
更新2:百度贴吧修复了上面的破绽,但没有做的很绝(&#8238和8236还可以用)。仍然有简单办法欺骗视觉,有心自然会发现。真的很怀疑是不是一些人和网站太高调了导致那样,这次我不多嘴了。

至于破解DZ论坛限制,并不是真正意义上少于20字,(在编辑页面文字最后插入20个论坛代码也可以)而是发一些浏览器看不见而系统又计入字数的字符罢了,让别人看到你发个空白是不是很厉害,哈哈,全当娱乐了,例如,你用几个汉字搭配20个LRM字符就能发出去了,下面的字母S和F之间就有20个这样的字符,你复制到回复框,删除S和F后就可以发了。
不好意思,我在此处打不出来了也不能复制了,你自己在记事本里慢慢打吧,点击右键选”插入Unicode控制字符 “,只插入LRM20个(如果你不熟悉别用其它字符)。保存的时候选择Unicode 编码。

附录1:

Note that in context digit mode, any digits encountered before the first letters are rendered in SCRIPT_CONTROL.uDefaultLanguage if that script is in the same direction as the output, and in Arabic-Indic, that is, Western, digits if the direction is opposite. For example if SCRIPT_CONTROL.uDefaultLanguage is LANG_ARABIC, initial digits will be in Arabic-Indic in a RTL embedding, but in Western, which is also known as Arabic, in a LTR embedding.
Effect of Unicode control characters on SCRIPT_STATE.
SCRIPT_STATE flag
Set by
Cleared by
fDigitSubstitute
NADS
NODS
fInhibitSymSwap
ISS
ASS
fCharShape
AAFS
IAFS
Note: The Unicode control characters are defined in the following table. For more information, see the Unicode Standard.
Unicode Control Characters
Meaning
NADS
Overrides Western digits (NODS) with national digit    shapes
NODS
Nominal digit shapes, otherwise known as Western digits. See NADS.
ASS
Activates swapping of symmetric pairs (for example, parentheses). For these characters, left and right are interpreted as opening and closing. This is the default. See ISS.
ISS
Inhibits swapping of symmetric pairs. See ASS.
AAFS
Activates Arabic form shaping, that is, ligatures or cursive connections, for Arabic presentation forms. See IAFS.
IAFS
Inhibits Arabic form shaping, that is ligatures and cursive connections, for Arabic presentation forms. Nominal Arabic characters are not affected. This is the default. See AAFS.

附录2:

RLM Right-to-left mark 
ZWJ Zero width joiner 
ZWNJ Zero width non-joiner 
LRE Start of left-to-right embedding 
RLE Start of right-to-left embedding 
LRO Start of left-to-right override 
RLO Start of right-to-left override 
PDF Pop directional formatting 
NADS National digit shapes substitution 
NODS Nominal(European)digit shanpes 
ASS Activate symmetric swapping 
ISS Inhibit symmetric swapping 
AAFS Activate Arabic form shaping 
IAFS Inhibit Arabic form shaping 
RS Record Separator(Block separator) 
US Unit Separator(segment separator)