文件名称:article-title:提取HTML文档的文章标题
文件大小:332KB
文件格式:ZIP
更新时间:2024-05-21 00:35:11
HTML
文章标题
提取HTML文档的文章标题
通常很难从页面上获取文章的实际标题,因为作者要么在<title>添加了一堆垃圾,要么根本不使用它。 也没有标准化的方法在标记中指示文章的标题。 该模块使用一些试探法将其干净地提取出来。
安装
$ npm install article-title
用法
import articleTitle from 'article-title' ;
const html = `
<!doctype html>
<html>
<head>
<title>My awesome unicorn website</title>
</head>
<body>
...How unicorns sleep