请问有什么办法可以将webbrowser控件打开的网页内容保存成HTML源文件到本地??
谢谢
8 个解决方案
#1
帮顶
#2
只要把以下代码中的EmbeddedWB1换成webbrowser就行了
unit Unit1;
interface
uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, OleCtrls, SHDocVw_TLB, EmbeddedWB, ActiveX;
type
TForm1 = class(TForm)
EmbeddedWB1: TEmbeddedWB;
Memo1: TMemo;
Button1: TButton;
procedure Button1Click(Sender: TObject);
procedure FormCreate(Sender: TObject);
private
{ Private declarations }
public
{ Public declarations }
end;
var
Form1: TForm1;
implementation
{$R *.dfm}
procedure WB_GetDocumentSourceToStream(Document: IDispatch; Stream: TStream);
// Save a TWebbrowser Document to a Stream
var
PersistStreamInit: IPersistStreamInit;
StreamAdapter: IStream;
begin
Assert(Assigned(Document));
Stream.Size := 0;
Stream.Position := 0;
if Document.QueryInterface(IPersistStreamInit,
PersistStreamInit) = S_OK then
begin
StreamAdapter := TStreamAdapter.Create(Stream, soReference);
PersistStreamInit.Save(StreamAdapter, False);
StreamAdapter := nil;
end;
end;
function WB_GetDocumentSourceToString(Document: IDispatch): string;
// Save a Webbrowser Document to a string
var
Stream: TStringStream;
begin
Result := '';
Stream := TStringStream.Create('');
try
WB_GetDocumentSourceToStream(Document, Stream);
Result := StringReplace(Stream.Datastring, #$A#9, #$D#$A, [rfReplaceAll]);
Result := StringReplace(Result, #$A, #$D#$A, [rfReplaceAll]);
finally
Stream.Free;
end;
end;
procedure TForm1.Button1Click(Sender: TObject);
begin
Memo1.Lines.Text:=WB_GetDocumentSourceToString(EmbeddedWB1.Document);
end;
procedure TForm1.FormCreate(Sender: TObject);
begin
EmbeddedWB1.Navigate('http://10.113.58.5');
end;
end.
#3
还是不行啊,得到的结果在MEMO1里显示的只是一个 ? 号。
其它什么都没有。
急。。。。。。。
其它什么都没有。
急。。。。。。。
#4
你要保存为网页的话,可以把楼上第二个函数的改一下
如下:
procedure TForm1.Button2Click(Sender: TObject);
var
FilePath: string;
meoMry: TMemoryStream;
begin
Filepath := 'C:\';
try
meomry := TMemoryStream.Create;
WB_GetDocumentSourceToStream(WebBS.Document, MeoMry);
MeoMry.SaveToFile(FilePath + 'aaa.html');
finally
Meomry.Free;
end;
end;
如下:
procedure TForm1.Button2Click(Sender: TObject);
var
FilePath: string;
meoMry: TMemoryStream;
begin
Filepath := 'C:\';
try
meomry := TMemoryStream.Create;
WB_GetDocumentSourceToStream(WebBS.Document, MeoMry);
MeoMry.SaveToFile(FilePath + 'aaa.html');
finally
Meomry.Free;
end;
end;
#5
二楼的函数在直接打开指定网址的情况下,可以保存住网页的HTML代码。
但是我在webbrowser中编辑输入字符,这时再保存,HTML代码是乱码。显示出来的也是一个 “?”号。
其实我想得到webbrowser在编辑状态下输入内容后,它的HTML代码,最重要的是得到的HTML代码可以装进TStrings对象中。上面的兄弟的函数得出的结果在TStrings里是乱码。。
#6
zhuobin654:
按你的方法,可以将webbrowser编辑时输入的内容保存为html文件,也可以保存为文本文件。但是都不能将HTML代码装入到TStrings中,装入的结果还是一个“?”号。
按你的方法,可以将webbrowser编辑时输入的内容保存为html文件,也可以保存为文本文件。但是都不能将HTML代码装入到TStrings中,装入的结果还是一个“?”号。
#7
先前以为你要保存html文件呢
保存代码更简单
方法如下:
下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);
同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);
最后注意要引用mshtml单元。
保存代码更简单
方法如下:
下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);
同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);
最后注意要引用mshtml单元。
#8
zhoubin654,
你的方法只是取出Body的内容,也就是仅取出在webbrowser中输入的文字。不能取出webbrowser的完整HTML代码。而我要的就是webbrowser编辑状态手工输入文字后的完全HTML代码。
你的方法只是取出Body的内容,也就是仅取出在webbrowser中输入的文字。不能取出webbrowser的完整HTML代码。而我要的就是webbrowser编辑状态手工输入文字后的完全HTML代码。
#1
帮顶
#2
只要把以下代码中的EmbeddedWB1换成webbrowser就行了
unit Unit1;
interface
uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, OleCtrls, SHDocVw_TLB, EmbeddedWB, ActiveX;
type
TForm1 = class(TForm)
EmbeddedWB1: TEmbeddedWB;
Memo1: TMemo;
Button1: TButton;
procedure Button1Click(Sender: TObject);
procedure FormCreate(Sender: TObject);
private
{ Private declarations }
public
{ Public declarations }
end;
var
Form1: TForm1;
implementation
{$R *.dfm}
procedure WB_GetDocumentSourceToStream(Document: IDispatch; Stream: TStream);
// Save a TWebbrowser Document to a Stream
var
PersistStreamInit: IPersistStreamInit;
StreamAdapter: IStream;
begin
Assert(Assigned(Document));
Stream.Size := 0;
Stream.Position := 0;
if Document.QueryInterface(IPersistStreamInit,
PersistStreamInit) = S_OK then
begin
StreamAdapter := TStreamAdapter.Create(Stream, soReference);
PersistStreamInit.Save(StreamAdapter, False);
StreamAdapter := nil;
end;
end;
function WB_GetDocumentSourceToString(Document: IDispatch): string;
// Save a Webbrowser Document to a string
var
Stream: TStringStream;
begin
Result := '';
Stream := TStringStream.Create('');
try
WB_GetDocumentSourceToStream(Document, Stream);
Result := StringReplace(Stream.Datastring, #$A#9, #$D#$A, [rfReplaceAll]);
Result := StringReplace(Result, #$A, #$D#$A, [rfReplaceAll]);
finally
Stream.Free;
end;
end;
procedure TForm1.Button1Click(Sender: TObject);
begin
Memo1.Lines.Text:=WB_GetDocumentSourceToString(EmbeddedWB1.Document);
end;
procedure TForm1.FormCreate(Sender: TObject);
begin
EmbeddedWB1.Navigate('http://10.113.58.5');
end;
end.
#3
还是不行啊,得到的结果在MEMO1里显示的只是一个 ? 号。
其它什么都没有。
急。。。。。。。
其它什么都没有。
急。。。。。。。
#4
你要保存为网页的话,可以把楼上第二个函数的改一下
如下:
procedure TForm1.Button2Click(Sender: TObject);
var
FilePath: string;
meoMry: TMemoryStream;
begin
Filepath := 'C:\';
try
meomry := TMemoryStream.Create;
WB_GetDocumentSourceToStream(WebBS.Document, MeoMry);
MeoMry.SaveToFile(FilePath + 'aaa.html');
finally
Meomry.Free;
end;
end;
如下:
procedure TForm1.Button2Click(Sender: TObject);
var
FilePath: string;
meoMry: TMemoryStream;
begin
Filepath := 'C:\';
try
meomry := TMemoryStream.Create;
WB_GetDocumentSourceToStream(WebBS.Document, MeoMry);
MeoMry.SaveToFile(FilePath + 'aaa.html');
finally
Meomry.Free;
end;
end;
#5
二楼的函数在直接打开指定网址的情况下,可以保存住网页的HTML代码。
但是我在webbrowser中编辑输入字符,这时再保存,HTML代码是乱码。显示出来的也是一个 “?”号。
其实我想得到webbrowser在编辑状态下输入内容后,它的HTML代码,最重要的是得到的HTML代码可以装进TStrings对象中。上面的兄弟的函数得出的结果在TStrings里是乱码。。
#6
zhuobin654:
按你的方法,可以将webbrowser编辑时输入的内容保存为html文件,也可以保存为文本文件。但是都不能将HTML代码装入到TStrings中,装入的结果还是一个“?”号。
按你的方法,可以将webbrowser编辑时输入的内容保存为html文件,也可以保存为文本文件。但是都不能将HTML代码装入到TStrings中,装入的结果还是一个“?”号。
#7
先前以为你要保存html文件呢
保存代码更简单
方法如下:
下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);
同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);
最后注意要引用mshtml单元。
保存代码更简单
方法如下:
下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);
同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);
最后注意要引用mshtml单元。
#8
zhoubin654,
你的方法只是取出Body的内容,也就是仅取出在webbrowser中输入的文字。不能取出webbrowser的完整HTML代码。而我要的就是webbrowser编辑状态手工输入文字后的完全HTML代码。
你的方法只是取出Body的内容,也就是仅取出在webbrowser中输入的文字。不能取出webbrowser的完整HTML代码。而我要的就是webbrowser编辑状态手工输入文字后的完全HTML代码。