文件名称:metascraper:Go实用程序,用于抓取网页元数据,支持开放图,schema.org等
文件大小:9KB
文件格式:ZIP
更新时间:2024-06-12 03:00:24
Go
超级刮板 Metascraper是一个Web抓取实用程序。 它将有效HTML标记转换为Go结构的层次结构。 除了在给定的端点捕获原始HTML之外,metascraper还将从页面的头部拉出meta标签,并提取嵌入在文档主体中的schema.org元数据。 用法 p , err := metascraper . Scrape ( url ) if err != nil { log . Fatal ( err ) } log . Println ( p . Title ) pretty . Print ( p . MetaData ()) pretty . Print ( p . SchemaData ()) 请参阅 根据
【文件预览】:
metascraper-master
----reader.go(2KB)
----page.go(4KB)
----meta.go(3KB)
----page_test.go(6KB)
----doc.go(1KB)
----README.md(639B)
----public.go(698B)
----schema.go(4KB)
----.gitignore(38B)