C#提取物通过OLEDB格式的文本从Excel(C# extract formatted text

2019-08-02 11:16发布

我从一个大的读取数据excel已经得到了格式化文本文件。 我提取数据,以DataTable通过对象oleDBConnectionGetOleDbSchemaTable 。 但所提取的数据不包括任何格式的信息。

我的要求是,我需要提取唯一的非删除线的文本。

我没有任何问题,同时阅读,一切都完美的罚款。 但我的提取应基于文本格式excel对此我无法找到解决方案。

在添加任何东西connectionString其是如下:

connectionString = "Provider=Microsoft.ACE.OLEDB.12.0;Data Source=" + fileName + "; Extended Properties=\"Excel 12.0 Xml;HDR=YES;Mode=Read;ReadOnly=True;\"";

约束:

  1. 使用的OleDbConnection - 无互操作

  2. 从阅读中DataTable对象

Answer 1:

据我所知,你不能只用ACE驾驶员做到这一点。 话虽这么说,如果约束不断提升,这是使用工具: http://closedxml.codeplex.com/



Answer 2:

你应该切换您的方法来使用Open XML。 这是.NET,COM不

信息: http://support.microsoft.com/kb/840817

下载SDK: http://www.microsoft.com/en-us/download/details.aspx?displaylang=en&id=5124



Answer 3:

您必须使用“开放XML”去格式化信息,如果您不想使用互操作。 有没有其他的选择。 有夫,我只提的正确性,但你的连接字符串清楚地表明XML,所以比夫了。

一旦你通过“开放XML”打开,那么你可以“模拟”读取范围/表/细胞像一个DataTable

有了您的约束,只有#1会给你格式化信息。



文章来源: C# extract formatted text from Excel through OLEDB