下载使用WebRequests PDF文件(Downloading pdf file using W

2019-06-26 23:20发布

我想下载一些自动的给定的URL列表PDF文件。

下面是我的代码:

HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);

request.Method = "GET";

var encoding = new UTF8Encoding();

request.Headers.Add(HttpRequestHeader.AcceptLanguage, "en-gb,en;q=0.5");
request.Headers.Add(HttpRequestHeader.AcceptEncoding, "gzip, deflate");

request.Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8";
request.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:12.0) Gecko/20100101 Firefox/12.0";

HttpWebResponse resp = (HttpWebResponse)request.GetResponse();

BinaryReader reader = new BinaryReader(resp.GetResponseStream());

FileStream stream = new FileStream("output/" + date.ToString("yyyy-MM-dd") + ".pdf",FileMode.Create);

BinaryWriter writer = new BinaryWriter(stream);

while (reader.PeekChar() != -1)
      {
       writer.Write(reader.Read());
      }
       writer.Flush();
       writer.Close();

所以,我知道的第一部分作品。 原本我是得到它,并使用TextReader的阅读它 - 但是这给了我损坏的PDF文件(PDF文件,因为是二进制文件)。

现在如果我运行它,reader.PeekChar()始终是-1并没有任何反应 - 我得到一个空文件。

尽管调试它,我注意到,reader.Read()实际上是给不同的号码,当我调用它 - 所以也许皮克被打破。

所以,我想的东西很肮脏

try
{
 while (true)
   {
    writer.Write(reader.Read());
    }
 }
   catch
      {
      }
 writer.Flush();
 writer.Close();

现在我越来越有它的一些垃圾一个非常小的文件,但它仍然不是我要找的。

所以,任何人都可以点我在正确的方向?

附加信息:

头不建议其压缩或其他任何东西。

HTTP/1.1 200 OK
Content-Type: application/pdf
Server: Microsoft-IIS/7.5
X-Powered-By: ASP.NET
Date: Fri, 10 Aug 2012 11:15:48 GMT
Content-Length: 109809

Answer 1:

跳过BinaryReaderBinaryWriter和公正的输入流复制到输出FileStream 。 简要地

var fileName = "output/" + date.ToString("yyyy-MM-dd") + ".pdf";
using (var stream = File.Create(fileName))
  resp.GetResponseStream().CopyTo(stream);


Answer 2:

为什么不使用WebClient类?

using (WebClient webClient = new WebClient())
{
    webClient.DownloadFile("url", "filePath");
}


Answer 3:

你的问题询问有关WebClient ,但你的代码演示了使用原始HTTP请求和Resposnses。

你为什么不实际使用System.Net.WebClient

using(System.Net.WebClient wc = new WebClient()) 
{
    wc.DownloadFile("http://www.site.com/file.pdf",  "C:\\Temp\\File.pdf");
}


Answer 4:

私人无效Form1_Load的(对象发件人,EventArgs的){

        WebClient webClient = new WebClient();
        webClient.DownloadFileCompleted += new AsyncCompletedEventHandler(Completed);
        webClient.DownloadProgressChanged += new DownloadProgressChangedEventHandler(ProgressChanged);
        webClient.DownloadFileAsync(new Uri("https://www.colorado.gov/pacific/sites/default/files/Income1.pdf"), @"output/" + DateTime.Now.Ticks ("")+ ".pdf", FileMode.Create);
      }

    private void ProgressChanged(object sender, DownloadProgressChangedEventArgs e)
    {
        progressBar = e.ProgressPercentage;
    }

    private void Completed(object sender, AsyncCompletedEventArgs e)
    {
        MessageBox.Show("Download completed!");
    }
}

}



文章来源: Downloading pdf file using WebRequests