C# 网页图片采集

时间:2021-08-19 17:29:42

博客原文地址:https://www.cnblogs.com/qq260250932/p/5361043.html

using System;  

using System.Collections.Generic;  

using System.Linq;  

using System.Text;  

using System.Text.RegularExpressions;  

using System.Net;  

using System.IO;  

using System.Windows.Forms;  

namespace ImageCollect  

{  

    public class GatherPic  

    {  

        private string savePath;  

        private string getUrl;  

        private WebBrowser wb;  

        private int iImgCount;  

        //初始化参数  

        public GatherPic(string sWebUrl, string sSavePath)  

        {  

            this.getUrl = sWebUrl;  

            this.savePath = sSavePath;  

        }  

        //开始采集  

        public bool start()  

        {  

            if (getUrl.Trim().Equals(""))  

            {  

                MessageBox.Show("哪来的虾米连网址都没输!");  

                return false;  

            }  

            this.wb = new WebBrowser();  

            this.wb.Navigate(getUrl);  

            //委托事件  

            this.wb.DocumentCompleted += new System.Windows.Forms.WebBrowserDocumentCompletedEventHandler(DocumentCompleted);  

            return true;  

        }  

        //WebBrowser.DocumentCompleted委托事件  

        private void DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)  

        {  

            //页面里框架iframe加载完成不掉用SearchImgList()  

            if (e.Url != wb.Document.Url) return;  

            SearchImgList();  

        }  

        //检查出所有图片并采集到本地  

        public void SearchImgList()  

        {  

            string sImgUrl;  

            //取得所有图片地址