参考网址:
代码:http://blog.sina.com.cn/s/blog_700aa8830101gjb5.html
执行界面:http://pan.baidu.com/s/1eQiw08M
当复制VS2010中带有中文字符的代码到Office(Word, Excel, PowerPoint, Outlook)时,
在中文字符后面会被添加一到三个乱码。比如复制"中文字符",粘贴到word就会变成(中D文?字Á?符¤?)。例如:
<span style="font-size:14px;">#include "stdio.h"
int main(){
printf( "新? 浪¤? 博? 客¨ª 你? 让¨? 我¨° 情¨¦ 何? 以°? 堪¡ã\n" );
return 0;
}</span>
网上虽然有解决方法,比如说,先复制到记事本中,然后在复制到Word中,但是一般从vs里面复制出来,然后粘贴到Word中主要是想代码在Word中也可以显示高亮。而复制到记事本中,会将格式信息删除,得到纯文本。
通过黑暗执行绪的一篇文章提示,截取剪贴板中RTF(富文本格式)的数据流,并作出修复。该作者使用了 .NET中的正则表达式类RegEx来达到修复目的。方法调用很简单,感兴趣的可以搜索一下作者的博客空间。
该怎么办呢?据说,这个问题是vs2010在每个中文后都会加上一些其他的信息,导致在word中显示的是乱码。有些大牛,给出了完美的解决方案,写了个c#程序,从剪切板读取字符串,然后把那些多余的信息去掉,这样再粘贴就没事了,他的代码如下:
//每个中文字后会连着一到两个多余字元
private void btnFix_Click( object sender, EventArgs e)
{
//取得剪贴板内容
IDataObject dataObject = Clipboard.GetDataObject();
if (dataObject.GetDataPresent(DataFormats.Rtf))
{
//取出RTF格式
string rtf = dataObject.GetData(DataFormats.Rtf) as string ;
//以Regex.Replace去除多余字元(注: 不管是否有问题,一律强制处理)
string fixedRtf =
Regex.Replace(rtf, @"\\uinput2(?\\u-?\d*)\s.." ,
(m) =>
{
return m.Groups[ "uc" ].Value + "?" ;
});
//另建新DataObject物件
DataObject newDataObject = new DataObject();
//RTF格式用修正后的字串,其余依原值
foreach (String t in dataObject.GetFormats())
newDataObject.SetData(t,
t == "Rich Text Format" ? fixedRtf :
dataObject.GetData(t));
//将修正后内容写入剪贴簿
Clipboard.SetDataObject(newDataObject, true );
}
}
上面是参考程序,我从另外一个地方还下载了可执行程序,界面如下:
首先,复制VS2010中的代码,然后点击上述界面的修复按钮,最后在word文档中粘贴的结果就是没有乱码且保留原有格式的文本了。beautiful!