如何将webbrowser页面的内容保存为HTML文件?

时间:2022-07-06 11:51:22
各位:

请问有什么办法可以将webbrowser控件打开的网页内容保存成HTML源文件到本地??

谢谢

8 个解决方案

#1


帮顶

#2


只要把以下代码中的EmbeddedWB1换成webbrowser就行了


unit Unit1;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls, OleCtrls, SHDocVw_TLB, EmbeddedWB, ActiveX;

type
  TForm1 = class(TForm)
    EmbeddedWB1: TEmbeddedWB;
    Memo1: TMemo;
    Button1: TButton;
    procedure Button1Click(Sender: TObject);
    procedure FormCreate(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

procedure WB_GetDocumentSourceToStream(Document: IDispatch; Stream: TStream);
// Save a TWebbrowser Document to a Stream
var
  PersistStreamInit: IPersistStreamInit;
  StreamAdapter: IStream;
begin
  Assert(Assigned(Document));
  Stream.Size := 0;
  Stream.Position := 0;
  if Document.QueryInterface(IPersistStreamInit,
    PersistStreamInit) = S_OK then
  begin
    StreamAdapter := TStreamAdapter.Create(Stream, soReference);
    PersistStreamInit.Save(StreamAdapter, False);
    StreamAdapter := nil;
  end;
end;

function WB_GetDocumentSourceToString(Document: IDispatch): string;
// Save a Webbrowser Document to a string
var
  Stream: TStringStream;
begin
  Result := '';
  Stream := TStringStream.Create('');
  try
    WB_GetDocumentSourceToStream(Document, Stream);
    Result := StringReplace(Stream.Datastring, #$A#9, #$D#$A, [rfReplaceAll]);
    Result := StringReplace(Result, #$A, #$D#$A, [rfReplaceAll]);
  finally
    Stream.Free;
  end;
end;

procedure TForm1.Button1Click(Sender: TObject);
begin
  Memo1.Lines.Text:=WB_GetDocumentSourceToString(EmbeddedWB1.Document);
end;

procedure TForm1.FormCreate(Sender: TObject);
begin
  EmbeddedWB1.Navigate('http://10.113.58.5');
end;

end.

#3


还是不行啊,得到的结果在MEMO1里显示的只是一个 ? 号。

其它什么都没有。

急。。。。。。。

#4


你要保存为网页的话,可以把楼上第二个函数的改一下
如下:
procedure TForm1.Button2Click(Sender: TObject);
var
  FilePath: string;
  meoMry: TMemoryStream;
begin
  Filepath := 'C:\';
  try
    meomry :=  TMemoryStream.Create;
    WB_GetDocumentSourceToStream(WebBS.Document, MeoMry);
    MeoMry.SaveToFile(FilePath + 'aaa.html');
  finally
    Meomry.Free;
  end;

end;

#5




二楼的函数在直接打开指定网址的情况下,可以保存住网页的HTML代码。
但是我在webbrowser中编辑输入字符,这时再保存,HTML代码是乱码。显示出来的也是一个 “?”号。

其实我想得到webbrowser在编辑状态下输入内容后,它的HTML代码,最重要的是得到的HTML代码可以装进TStrings对象中。上面的兄弟的函数得出的结果在TStrings里是乱码。。
 

#6


zhuobin654:

按你的方法,可以将webbrowser编辑时输入的内容保存为html文件,也可以保存为文本文件。但是都不能将HTML代码装入到TStrings中,装入的结果还是一个“?”号。

#7


先前以为你要保存html文件呢
  保存代码更简单
 方法如下:
下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。

      Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml); 

    同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:

      Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText); 

最后注意要引用mshtml单元。

#8


zhoubin654,

你的方法只是取出Body的内容,也就是仅取出在webbrowser中输入的文字。不能取出webbrowser的完整HTML代码。而我要的就是webbrowser编辑状态手工输入文字后的完全HTML代码。

#1


帮顶

#2


只要把以下代码中的EmbeddedWB1换成webbrowser就行了


unit Unit1;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls, OleCtrls, SHDocVw_TLB, EmbeddedWB, ActiveX;

type
  TForm1 = class(TForm)
    EmbeddedWB1: TEmbeddedWB;
    Memo1: TMemo;
    Button1: TButton;
    procedure Button1Click(Sender: TObject);
    procedure FormCreate(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

procedure WB_GetDocumentSourceToStream(Document: IDispatch; Stream: TStream);
// Save a TWebbrowser Document to a Stream
var
  PersistStreamInit: IPersistStreamInit;
  StreamAdapter: IStream;
begin
  Assert(Assigned(Document));
  Stream.Size := 0;
  Stream.Position := 0;
  if Document.QueryInterface(IPersistStreamInit,
    PersistStreamInit) = S_OK then
  begin
    StreamAdapter := TStreamAdapter.Create(Stream, soReference);
    PersistStreamInit.Save(StreamAdapter, False);
    StreamAdapter := nil;
  end;
end;

function WB_GetDocumentSourceToString(Document: IDispatch): string;
// Save a Webbrowser Document to a string
var
  Stream: TStringStream;
begin
  Result := '';
  Stream := TStringStream.Create('');
  try
    WB_GetDocumentSourceToStream(Document, Stream);
    Result := StringReplace(Stream.Datastring, #$A#9, #$D#$A, [rfReplaceAll]);
    Result := StringReplace(Result, #$A, #$D#$A, [rfReplaceAll]);
  finally
    Stream.Free;
  end;
end;

procedure TForm1.Button1Click(Sender: TObject);
begin
  Memo1.Lines.Text:=WB_GetDocumentSourceToString(EmbeddedWB1.Document);
end;

procedure TForm1.FormCreate(Sender: TObject);
begin
  EmbeddedWB1.Navigate('http://10.113.58.5');
end;

end.

#3


还是不行啊,得到的结果在MEMO1里显示的只是一个 ? 号。

其它什么都没有。

急。。。。。。。

#4


你要保存为网页的话,可以把楼上第二个函数的改一下
如下:
procedure TForm1.Button2Click(Sender: TObject);
var
  FilePath: string;
  meoMry: TMemoryStream;
begin
  Filepath := 'C:\';
  try
    meomry :=  TMemoryStream.Create;
    WB_GetDocumentSourceToStream(WebBS.Document, MeoMry);
    MeoMry.SaveToFile(FilePath + 'aaa.html');
  finally
    Meomry.Free;
  end;

end;

#5




二楼的函数在直接打开指定网址的情况下,可以保存住网页的HTML代码。
但是我在webbrowser中编辑输入字符,这时再保存,HTML代码是乱码。显示出来的也是一个 “?”号。

其实我想得到webbrowser在编辑状态下输入内容后,它的HTML代码,最重要的是得到的HTML代码可以装进TStrings对象中。上面的兄弟的函数得出的结果在TStrings里是乱码。。
 

#6


zhuobin654:

按你的方法,可以将webbrowser编辑时输入的内容保存为html文件,也可以保存为文本文件。但是都不能将HTML代码装入到TStrings中,装入的结果还是一个“?”号。

#7


先前以为你要保存html文件呢
  保存代码更简单
 方法如下:
下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。

      Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml); 

    同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:

      Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText); 

最后注意要引用mshtml单元。

#8


zhoubin654,

你的方法只是取出Body的内容,也就是仅取出在webbrowser中输入的文字。不能取出webbrowser的完整HTML代码。而我要的就是webbrowser编辑状态手工输入文字后的完全HTML代码。