HRESULT hr;
try
{
int nCount = m_spSHWinds->GetCount();
CComPtr<IDispatch> spDisp;
for (int i = 0;i < nCount;i++)
{
_variant_t v = (long)i;
spDisp = m_spSHWinds->Item(v);
SHDocVw::IWebBrowser2Ptr spBrowser(spDisp);
if (spBrowser)
{
bsName = spBrowser->GetLocationName();
IHTMLDocument2Ptr spDoc(spBrowser->GetDocument());
if (spDoc != NULL)
{
int nPos = m_list2.InsertItem(0,bsName);
char* nm = bsName;
UpdateData(FALSE);
CString tmp = nm;
m_EditName += "\r\n";
m_EditName += nm;
UpdateData(FALSE);
TRACE(bsName);
spBrowser->AddRef();
void* pData = spBrowser;
m_list2.SetItemData(nPos,(DWORD)pData);
CComPtr<IDispatch> pElemDisp ;
IHTMLElementCollectionPtr pElemColl ;
IHTMLElementPtr pElem ;
long length;
hr = spDoc->get_body(&pElem);
if (FAILED(hr))
{
AfxMessageBox("get_dody函数失败!");
}
hr = spDoc->get_all(&pElemColl);
if (FAILED(hr))
{
AfxMessageBox("获取页面元素集失败!");
}
hr = pElemColl->get_length(&length);
if (SUCCEEDED(hr))
{
for (int i = 0;i<length;i ++)
{
_variant_t index;
index.vt = VT_I4;
index.intVal = i;
hr = pElemColl->item(index,index,&pElemDisp);
if (pElemDisp == NULL)
{
AfxMessageBox("没有找到所需要的资源!");
continue;
}
AfxMessageBox("找到:)");
CComQIPtr<IHTMLAnchorElement,&IID_IHTMLAnchorElement>pAnchorElement;
if (SUCCEEDED(hr))
{
pElemDisp->QueryInterface(&pAnchorElement);
BSTR bstr = NULL;
pAnchorElement->get_href(&bstr);
if (FAILED(hr))
{
AfxMessageBox("没有找到资源!");
}
else
{
_bstr_t temp = bstr;
char* show = temp;
AfxMessageBox(temp);
}
}
}
}
}
}
}
}
catch (CException* e)
{
char buffer[1024];
e->GetErrorMessage(buffer,1024);
}
7 个解决方案
#1
一、基本原理
首先是用IHTMLDocument2的get_links,来获取IHTMLElementCollection接口,再通过IHTMLElementCollection来获取IHTMLAnchorElement,而IHTMLAnchorElement接口的get_href就是我们想要的,通过循环获取,我们就可以得到网页的所有链接了!
二、具体代码
{
TCHAR HostName[2*MAX_PATH];
CComPtr<IDispatch> spDispatch;
CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2> pDoc2;
CComPtr<IHTMLElementCollection> pElementCol;
CComPtr<IHTMLAnchorElement> pLoct;
// TODO: Add your control notification handler code here
int n = m_LinksList.GetItemCount();//GetCount();
for (int i = 0; i < n; i ++){
IWebBrowser2 *pBrowser = (IWebBrowser2 *)m_LinksList.GetItemData(i);
if (pBrowser){
pBrowser->Release();
}
}
m_LinksList.DeleteAllItems();
m_LinksNum = 0;
Log("**************************************************************");
Log("\r\n");
if (m_spSHWinds){
int n = m_spSHWinds->GetCount();
for (int i = 0; i < n; i++){
_variant_t v = (long)i;
IDispatchPtr spDisp = m_spSHWinds->Item(v);
SHDocVw::IWebBrowser2Ptr spBrowser(spDisp); //生成一个IE窗口的智能指针
if (spBrowser){
if (SUCCEEDED(spBrowser->get_Document( &spDispatch)))
pDoc2 = spDispatch;
if(pDoc2!=NULL)
{
if (SUCCEEDED(pDoc2->get_links(&pElementCol)))
{
// AfxMessageBox("IHTMLElementCollection");
long p=0;
if(SUCCEEDED(pElementCol->get_length(&p)))
if(p!=0)
{
m_LinksNum = m_LinksNum+p;
UpdateData(FALSE);
for(long i=0;i<=(p-1);i++)
{
BSTR String;
_variant_t index = i;
if(SUCCEEDED(pElementCol->item( index, index, &spDispatch)))
if(SUCCEEDED(spDispatch->QueryInterface( IID_IHTMLAnchorElement,(void **) &pLoct)))
pLoct->get_href(&String);
ZeroMemory(HostName,2*MAX_PATH);
lstrcpy(HostName,_bstr_t(String));
m_LinksList.InsertItem(i,HostName);
m_LinksList.SetCheck(i,TRUE);
pLoct->get_hostname(&String);
ZeroMemory(HostName,2*MAX_PATH);
lstrcpy(HostName,_bstr_t(String));
if(lstrlen(HostName))
{
m_LinksList.SetItemText(i,1,HostName);
Log(HostName );
Log("\r\n");
}
}
}
}
}
}
}
}
}
首先是用IHTMLDocument2的get_links,来获取IHTMLElementCollection接口,再通过IHTMLElementCollection来获取IHTMLAnchorElement,而IHTMLAnchorElement接口的get_href就是我们想要的,通过循环获取,我们就可以得到网页的所有链接了!
二、具体代码
{
TCHAR HostName[2*MAX_PATH];
CComPtr<IDispatch> spDispatch;
CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2> pDoc2;
CComPtr<IHTMLElementCollection> pElementCol;
CComPtr<IHTMLAnchorElement> pLoct;
// TODO: Add your control notification handler code here
int n = m_LinksList.GetItemCount();//GetCount();
for (int i = 0; i < n; i ++){
IWebBrowser2 *pBrowser = (IWebBrowser2 *)m_LinksList.GetItemData(i);
if (pBrowser){
pBrowser->Release();
}
}
m_LinksList.DeleteAllItems();
m_LinksNum = 0;
Log("**************************************************************");
Log("\r\n");
if (m_spSHWinds){
int n = m_spSHWinds->GetCount();
for (int i = 0; i < n; i++){
_variant_t v = (long)i;
IDispatchPtr spDisp = m_spSHWinds->Item(v);
SHDocVw::IWebBrowser2Ptr spBrowser(spDisp); //生成一个IE窗口的智能指针
if (spBrowser){
if (SUCCEEDED(spBrowser->get_Document( &spDispatch)))
pDoc2 = spDispatch;
if(pDoc2!=NULL)
{
if (SUCCEEDED(pDoc2->get_links(&pElementCol)))
{
// AfxMessageBox("IHTMLElementCollection");
long p=0;
if(SUCCEEDED(pElementCol->get_length(&p)))
if(p!=0)
{
m_LinksNum = m_LinksNum+p;
UpdateData(FALSE);
for(long i=0;i<=(p-1);i++)
{
BSTR String;
_variant_t index = i;
if(SUCCEEDED(pElementCol->item( index, index, &spDispatch)))
if(SUCCEEDED(spDispatch->QueryInterface( IID_IHTMLAnchorElement,(void **) &pLoct)))
pLoct->get_href(&String);
ZeroMemory(HostName,2*MAX_PATH);
lstrcpy(HostName,_bstr_t(String));
m_LinksList.InsertItem(i,HostName);
m_LinksList.SetCheck(i,TRUE);
pLoct->get_hostname(&String);
ZeroMemory(HostName,2*MAX_PATH);
lstrcpy(HostName,_bstr_t(String));
if(lstrlen(HostName))
{
m_LinksList.SetItemText(i,1,HostName);
Log(HostName );
Log("\r\n");
}
}
}
}
}
}
}
}
}
#2
太谢谢你了:)
#3
既然封装了xxxPtr,就没有必要再使用CComPtr/CComQIPtr了。例如
...
IHTMLAnchorElementPtr spAnchor = pElemColl->item((LONG)i, vtMissing);
if (spAnchor) // 这句话一定需要,因为document->get_all获取的是所有元素,但不是所有元素都是anchor元素,只有anchor元素这个值才有效
{
_bstr_t bstr = spAnchor->href;
}
...
IHTMLAnchorElementPtr spAnchor = pElemColl->item((LONG)i, vtMissing);
if (spAnchor) // 这句话一定需要,因为document->get_all获取的是所有元素,但不是所有元素都是anchor元素,只有anchor元素这个值才有效
{
_bstr_t bstr = spAnchor->href;
}
#4
还要请教一个问题,就是如果在一个IE空白文档中输入一个URL,结果弹出一个没有菜单和工具栏的IE网页,用右键点击该网页也没有查看该网页源码的选项,这种情况下如何获得该网页的信息,还有弱弱的问一句,该网页说使用的技术是什么?还望各位高人再给点指点
#5
window.showModalDialog/showModelessDialog方法能创建这种网页,是否有菜单栏工具栏可以用参数控制。
#6
其实,就是用javascript脚本隐藏了上下文菜单,通常是重载掉document.onmouseup事件
要获得网页,简单地用javascript做:
http://topic.csdn.net/t/20020919/10/1035935.html
#7
谢谢楼上的各位给我的建议,明天去试试去先:)
#1
一、基本原理
首先是用IHTMLDocument2的get_links,来获取IHTMLElementCollection接口,再通过IHTMLElementCollection来获取IHTMLAnchorElement,而IHTMLAnchorElement接口的get_href就是我们想要的,通过循环获取,我们就可以得到网页的所有链接了!
二、具体代码
{
TCHAR HostName[2*MAX_PATH];
CComPtr<IDispatch> spDispatch;
CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2> pDoc2;
CComPtr<IHTMLElementCollection> pElementCol;
CComPtr<IHTMLAnchorElement> pLoct;
// TODO: Add your control notification handler code here
int n = m_LinksList.GetItemCount();//GetCount();
for (int i = 0; i < n; i ++){
IWebBrowser2 *pBrowser = (IWebBrowser2 *)m_LinksList.GetItemData(i);
if (pBrowser){
pBrowser->Release();
}
}
m_LinksList.DeleteAllItems();
m_LinksNum = 0;
Log("**************************************************************");
Log("\r\n");
if (m_spSHWinds){
int n = m_spSHWinds->GetCount();
for (int i = 0; i < n; i++){
_variant_t v = (long)i;
IDispatchPtr spDisp = m_spSHWinds->Item(v);
SHDocVw::IWebBrowser2Ptr spBrowser(spDisp); //生成一个IE窗口的智能指针
if (spBrowser){
if (SUCCEEDED(spBrowser->get_Document( &spDispatch)))
pDoc2 = spDispatch;
if(pDoc2!=NULL)
{
if (SUCCEEDED(pDoc2->get_links(&pElementCol)))
{
// AfxMessageBox("IHTMLElementCollection");
long p=0;
if(SUCCEEDED(pElementCol->get_length(&p)))
if(p!=0)
{
m_LinksNum = m_LinksNum+p;
UpdateData(FALSE);
for(long i=0;i<=(p-1);i++)
{
BSTR String;
_variant_t index = i;
if(SUCCEEDED(pElementCol->item( index, index, &spDispatch)))
if(SUCCEEDED(spDispatch->QueryInterface( IID_IHTMLAnchorElement,(void **) &pLoct)))
pLoct->get_href(&String);
ZeroMemory(HostName,2*MAX_PATH);
lstrcpy(HostName,_bstr_t(String));
m_LinksList.InsertItem(i,HostName);
m_LinksList.SetCheck(i,TRUE);
pLoct->get_hostname(&String);
ZeroMemory(HostName,2*MAX_PATH);
lstrcpy(HostName,_bstr_t(String));
if(lstrlen(HostName))
{
m_LinksList.SetItemText(i,1,HostName);
Log(HostName );
Log("\r\n");
}
}
}
}
}
}
}
}
}
首先是用IHTMLDocument2的get_links,来获取IHTMLElementCollection接口,再通过IHTMLElementCollection来获取IHTMLAnchorElement,而IHTMLAnchorElement接口的get_href就是我们想要的,通过循环获取,我们就可以得到网页的所有链接了!
二、具体代码
{
TCHAR HostName[2*MAX_PATH];
CComPtr<IDispatch> spDispatch;
CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2> pDoc2;
CComPtr<IHTMLElementCollection> pElementCol;
CComPtr<IHTMLAnchorElement> pLoct;
// TODO: Add your control notification handler code here
int n = m_LinksList.GetItemCount();//GetCount();
for (int i = 0; i < n; i ++){
IWebBrowser2 *pBrowser = (IWebBrowser2 *)m_LinksList.GetItemData(i);
if (pBrowser){
pBrowser->Release();
}
}
m_LinksList.DeleteAllItems();
m_LinksNum = 0;
Log("**************************************************************");
Log("\r\n");
if (m_spSHWinds){
int n = m_spSHWinds->GetCount();
for (int i = 0; i < n; i++){
_variant_t v = (long)i;
IDispatchPtr spDisp = m_spSHWinds->Item(v);
SHDocVw::IWebBrowser2Ptr spBrowser(spDisp); //生成一个IE窗口的智能指针
if (spBrowser){
if (SUCCEEDED(spBrowser->get_Document( &spDispatch)))
pDoc2 = spDispatch;
if(pDoc2!=NULL)
{
if (SUCCEEDED(pDoc2->get_links(&pElementCol)))
{
// AfxMessageBox("IHTMLElementCollection");
long p=0;
if(SUCCEEDED(pElementCol->get_length(&p)))
if(p!=0)
{
m_LinksNum = m_LinksNum+p;
UpdateData(FALSE);
for(long i=0;i<=(p-1);i++)
{
BSTR String;
_variant_t index = i;
if(SUCCEEDED(pElementCol->item( index, index, &spDispatch)))
if(SUCCEEDED(spDispatch->QueryInterface( IID_IHTMLAnchorElement,(void **) &pLoct)))
pLoct->get_href(&String);
ZeroMemory(HostName,2*MAX_PATH);
lstrcpy(HostName,_bstr_t(String));
m_LinksList.InsertItem(i,HostName);
m_LinksList.SetCheck(i,TRUE);
pLoct->get_hostname(&String);
ZeroMemory(HostName,2*MAX_PATH);
lstrcpy(HostName,_bstr_t(String));
if(lstrlen(HostName))
{
m_LinksList.SetItemText(i,1,HostName);
Log(HostName );
Log("\r\n");
}
}
}
}
}
}
}
}
}
#2
太谢谢你了:)
#3
既然封装了xxxPtr,就没有必要再使用CComPtr/CComQIPtr了。例如
...
IHTMLAnchorElementPtr spAnchor = pElemColl->item((LONG)i, vtMissing);
if (spAnchor) // 这句话一定需要,因为document->get_all获取的是所有元素,但不是所有元素都是anchor元素,只有anchor元素这个值才有效
{
_bstr_t bstr = spAnchor->href;
}
...
IHTMLAnchorElementPtr spAnchor = pElemColl->item((LONG)i, vtMissing);
if (spAnchor) // 这句话一定需要,因为document->get_all获取的是所有元素,但不是所有元素都是anchor元素,只有anchor元素这个值才有效
{
_bstr_t bstr = spAnchor->href;
}
#4
还要请教一个问题,就是如果在一个IE空白文档中输入一个URL,结果弹出一个没有菜单和工具栏的IE网页,用右键点击该网页也没有查看该网页源码的选项,这种情况下如何获得该网页的信息,还有弱弱的问一句,该网页说使用的技术是什么?还望各位高人再给点指点
#5
window.showModalDialog/showModelessDialog方法能创建这种网页,是否有菜单栏工具栏可以用参数控制。
#6
其实,就是用javascript脚本隐藏了上下文菜单,通常是重载掉document.onmouseup事件
要获得网页,简单地用javascript做:
http://topic.csdn.net/t/20020919/10/1035935.html
#7
谢谢楼上的各位给我的建议,明天去试试去先:)