guardian-bbc-scrape:GuardianBBC上的字数和使用频率

时间:2024-05-19 02:58:30
【文件属性】:

文件名称:guardian-bbc-scrape:GuardianBBC上的字数和使用频率

文件大小:92KB

文件格式:ZIP

更新时间:2024-05-19 02:58:30

Java

** bbc.py 重写下面的监护人代码。 本质上做同样的事情,但更整洁并使用python。 ** GuardianFun.java是要在src目录中运行的主程序 问:那是什么? 答:这是我最初编写的一些代码,因为我想知道如何使用Java读取网页。 同时,我正在听米歇尔·托马斯(Michel Thomas)的西班牙语课,他声称几年前进行的一项研究表明,要理解一本典型的《纽约时报》,您只需要大约600个单词即可。 (尽管他没有详细说明这到底意味着什么)。 问:这是做什么的? 答:主程序“ GuardianFun.java”将转到“卫报”(英国报纸)主页,然后访问指向故事的前100个链接


【文件预览】:
guardian-bbc-scrape-master
----Guardian_words_15thFeb_100links.dat(109KB)
----bbc.py(4KB)
----src()
--------WordAnalyser.java(5KB)
--------GetNextURL.java(3KB)
--------GetMainText.java(6KB)
--------GuardianFun.java(4KB)
--------Word.java(593B)
----15th_Feb.jpeg(39KB)
----weinstein.py(5KB)
----README.md(2KB)

网友评论