matlock:简单的名称提取实用程序

时间:2024-06-21 19:13:35
【文件属性】:

文件名称:matlock:简单的名称提取实用程序

文件大小:292KB

文件格式:ZIP

更新时间:2024-06-21 19:13:35

Ruby

马特洛克 概述 Matlock 是一个简单的名称提取实用程序。 从字符串中提取所有全名非常有用。 例如,传入一个网页的 HTML,它将返回一个提到的全名数组。 它的前提非常简单,并且面向美国的名字。 Matlock 从字符串中提取所有双字母组(名字、姓氏),其中名字或姓氏在美国人口普查常用名列表中。 已清理美国人口普查数据,以便删除常用词和美国城市和州。 您可以在lib/matlock/data目录中查看名称数据的完整列表。 入门 要使用 Matlock,只需安装 gem: $ gem install matlock 然后在您的脚本中只需要 gem 并从字符串中提取名称: require "matlock" require 'open-uri' html = open ( "http://cnn.com" ) . read matlock = Matlock . new ( )


【文件预览】:
matlock-master
----lib()
--------matlock()
--------matlock.rb(2KB)
----Gemfile(38B)
----Rakefile(1KB)
----LICENSE(1KB)
----test()
--------test_helper.rb(68B)
--------data_test.rb(1KB)
--------matlock_test.rb(1000B)
----README.md(1KB)
----matlock.gemspec(896B)
----Gemfile.lock(1KB)
----.gitignore(159B)
----bin()
--------matlock(1KB)

网友评论