- 2013-03-15 13:42:54 作者:有理想的码农
- 在对Excel进行读写操作时,使用微软自身提供的解决方案,有两种(第三方方式除外),分别是OLEDB方式和调用COM组件的方式
1. OLEDB方式
用这种方法读取Excel速度相对调用COM组件来讲是非常的快的,因为OLEDB方式就是把Excel当做一个数据库来操作的,将Excel作为一个数据源,直接用Sql语句获取数据。还有一个优点就是不需要安装Office Excel就可以使用。但是这种方式就是只能读取或者写入数据,但是对于Excel本身一些复杂的逻辑,如单元格合并,单元格着色等无法支持。
[csharp]
string connStr="";
if (fileType == ".xls")
connStr = "Provider=Microsoft.Jet.OLEDB.4.0;" + "Data Source=" + fileName + ";" + ";Extended Properties=\"Excel 8.0;HDR=YES;IMEX=1\"";
else
connStr = "Provider=Microsoft.ACE.OLEDB.12.0;" + "Data Source=" + fileName + ";" + ";Extended Properties=\"Excel 12.0;HDR=YES;IMEX=1\"";
string strCom = "SELECT * FROM [Part$A7:AE] where [Part No]=" + PartNO;
OleDbConnection myConn = new OleDbConnection(strCon);
OleDbDataAdapter myCommand = new OleDbDataAdapter(strCom)
System.Data.DataTable partTable = new System.Data.DataTable();
myCommand.Fill(partTable);
在这种方式下,Excel中的内容会放到DataTable中。一种常用的做法是,先使用OLEDB的方式把数据读取到DataTable中进行缓存,然后再在DataTable中进行符合条件的筛选或者处理。当然如果需要向Excel中写入数据的情况下,就要使用insert语句直接向Excel中输入了。需要注意一点,当Excel中的单元格为空时,返回到DataTable中的值是DBNull,使用Convert.ToString()转换后是“”,而如果使用Convert.ToInt32()转换会抛出异常,而不是0.
2. 调用COM组件的方式
这种方式需要先引用 Microsoft.Office.Interop.Excel 。可以非常灵活的读取Excel中的数据,而且使用方式很丰富,基本上凡是打开Office Excel软件能够用鼠标点击完成的事,使用VSTO调用COM组件都能完成,而且可以调用Excel自身带的宏方法等。但是,如果是Web站点部署在IIS上时,还需要服务器机子已安装了Excel,有时候还需要为配置IIS权限。最重要的一点因为是基于单元格方式读取的,所以数据很慢。个人建议是,如果在大数据的循环中,比如for(int i=0; i<10000;i++){……}在这里的逻辑中不要使用COM对象,因为毕竟COM对象是非托管代码,调用时会有一个托管对象到非托管对象的转换,这好比是要经过的一扇门,比较费时费力的。
在向Excel中写入数据的时候,如果有10000行,一行一行的调用COM的Range row对象去赋值,是相当慢。此时,可以使用一个数组,把值累积到数组中,最后把数组一次赋给到所有的需要赋值的区域。此时需要注意,Range的区域要和数组的维度完全对应,否者会有一些奇怪的符号出现。在实际开发中的感觉是,如果数据量很大,而且有多个Excel需要比对的话,可以两种方式结合使用,可以把某个Excel的sheet缓存到DataTable中,然后跟另外的Excel去比较,如果最终需要将大量的数据写入到Excel中的时候,可以使用二维数组赋值的方式再写回到Excel中。