看有没有大神之前遇到过类似的问题,提供一些思路。
下面为主要内容
----------------------------------割割割--------------------------------
比如我有一个地址字符串:北京市朝阳区XXXXXXX 要和系统表中的标准省市区 匹配。
这种字符串比较规范的还好。主要是有些字符串 根本不规范。 直接写一个 朝阳区XXXXX,现在问题来了,朝阳区不止北京有,其他省市也有。更有甚者,直接写朝阳XXXXXXXX。根本不知道朝阳是个区还是什么东西。。
有没大神遇到过此类问题 望赐教!
8 个解决方案
#1
[这个就类似搜索引擎了
你先需要使用中文分词工具 ,把用户输入的完整句子拆分成词语
再用这些词语部分组合进行模糊匹配, 去科大讯飞的官站下载demo,就可以了解基本的技术(主要看命令词识别和开放语义那部分的sdk)
虽然讯飞主要以语音见长,不过技术是差不多的技术,大体上就是类ABNF范式解出已知关键词,然后使用贝叶斯概率分析,或者神经网络推论, 为啥我印象里有人问过一样的问题?, 不得不说,csdn自带的搜索太shi,靠百度才找到的
http://bbs.csdn.net/topics/391993177
, 这个没有什么可以抄的“算法”。你要有丰富的业务知识,比如说可以详细询问客户,或者知道客户端的IP地址、电话号码、常用地址,等等,才能“接近于”解决问题。
如果你说这个是“算法”,那就过分技术化了。技术是死的,是干苦活儿的,才叫做技术。
而有些总是把人类都搞不懂的东西叫做技术,其实那就是为了抄点东西,而不是真正地在搞技术。, 这里不是“算法”这么简单。需要更深入100倍的条件,你有条件,再来谈应用。
话可以说透但是有些人未必能理解:比如说 google 搜索技术它的界面非常精简,稍微精致一些即可,为什么推出不久之后 google 的股价那么高?
有的人就说,我用一个 pc 电脑也来模仿这个界面吧。实际上在一个简单的“文本框”背后是几十万台、上百万台pc服务器,是面向到10、20年之后的互联网的形势而设计的网络系统。等你稍微深入一点说这个,这些人就不当真的,这些人只想要免费抄几行代码而已。, 我之前做过类似的, 求指点,我正在用地图的service尝试解决]
你先需要使用中文分词工具 ,把用户输入的完整句子拆分成词语
再用这些词语部分组合进行模糊匹配, 去科大讯飞的官站下载demo,就可以了解基本的技术(主要看命令词识别和开放语义那部分的sdk)
虽然讯飞主要以语音见长,不过技术是差不多的技术,大体上就是类ABNF范式解出已知关键词,然后使用贝叶斯概率分析,或者神经网络推论, 为啥我印象里有人问过一样的问题?, 不得不说,csdn自带的搜索太shi,靠百度才找到的
http://bbs.csdn.net/topics/391993177
, 这个没有什么可以抄的“算法”。你要有丰富的业务知识,比如说可以详细询问客户,或者知道客户端的IP地址、电话号码、常用地址,等等,才能“接近于”解决问题。
如果你说这个是“算法”,那就过分技术化了。技术是死的,是干苦活儿的,才叫做技术。
而有些总是把人类都搞不懂的东西叫做技术,其实那就是为了抄点东西,而不是真正地在搞技术。, 这里不是“算法”这么简单。需要更深入100倍的条件,你有条件,再来谈应用。
话可以说透但是有些人未必能理解:比如说 google 搜索技术它的界面非常精简,稍微精致一些即可,为什么推出不久之后 google 的股价那么高?
有的人就说,我用一个 pc 电脑也来模仿这个界面吧。实际上在一个简单的“文本框”背后是几十万台、上百万台pc服务器,是面向到10、20年之后的互联网的形势而设计的网络系统。等你稍微深入一点说这个,这些人就不当真的,这些人只想要免费抄几行代码而已。, 我之前做过类似的, 求指点,我正在用地图的service尝试解决]
#1
[这个就类似搜索引擎了
你先需要使用中文分词工具 ,把用户输入的完整句子拆分成词语
再用这些词语部分组合进行模糊匹配, 去科大讯飞的官站下载demo,就可以了解基本的技术(主要看命令词识别和开放语义那部分的sdk)
虽然讯飞主要以语音见长,不过技术是差不多的技术,大体上就是类ABNF范式解出已知关键词,然后使用贝叶斯概率分析,或者神经网络推论, 为啥我印象里有人问过一样的问题?, 不得不说,csdn自带的搜索太shi,靠百度才找到的
http://bbs.csdn.net/topics/391993177
, 这个没有什么可以抄的“算法”。你要有丰富的业务知识,比如说可以详细询问客户,或者知道客户端的IP地址、电话号码、常用地址,等等,才能“接近于”解决问题。
如果你说这个是“算法”,那就过分技术化了。技术是死的,是干苦活儿的,才叫做技术。
而有些总是把人类都搞不懂的东西叫做技术,其实那就是为了抄点东西,而不是真正地在搞技术。, 这里不是“算法”这么简单。需要更深入100倍的条件,你有条件,再来谈应用。
话可以说透但是有些人未必能理解:比如说 google 搜索技术它的界面非常精简,稍微精致一些即可,为什么推出不久之后 google 的股价那么高?
有的人就说,我用一个 pc 电脑也来模仿这个界面吧。实际上在一个简单的“文本框”背后是几十万台、上百万台pc服务器,是面向到10、20年之后的互联网的形势而设计的网络系统。等你稍微深入一点说这个,这些人就不当真的,这些人只想要免费抄几行代码而已。, 我之前做过类似的, 求指点,我正在用地图的service尝试解决]
你先需要使用中文分词工具 ,把用户输入的完整句子拆分成词语
再用这些词语部分组合进行模糊匹配, 去科大讯飞的官站下载demo,就可以了解基本的技术(主要看命令词识别和开放语义那部分的sdk)
虽然讯飞主要以语音见长,不过技术是差不多的技术,大体上就是类ABNF范式解出已知关键词,然后使用贝叶斯概率分析,或者神经网络推论, 为啥我印象里有人问过一样的问题?, 不得不说,csdn自带的搜索太shi,靠百度才找到的
http://bbs.csdn.net/topics/391993177
, 这个没有什么可以抄的“算法”。你要有丰富的业务知识,比如说可以详细询问客户,或者知道客户端的IP地址、电话号码、常用地址,等等,才能“接近于”解决问题。
如果你说这个是“算法”,那就过分技术化了。技术是死的,是干苦活儿的,才叫做技术。
而有些总是把人类都搞不懂的东西叫做技术,其实那就是为了抄点东西,而不是真正地在搞技术。, 这里不是“算法”这么简单。需要更深入100倍的条件,你有条件,再来谈应用。
话可以说透但是有些人未必能理解:比如说 google 搜索技术它的界面非常精简,稍微精致一些即可,为什么推出不久之后 google 的股价那么高?
有的人就说,我用一个 pc 电脑也来模仿这个界面吧。实际上在一个简单的“文本框”背后是几十万台、上百万台pc服务器,是面向到10、20年之后的互联网的形势而设计的网络系统。等你稍微深入一点说这个,这些人就不当真的,这些人只想要免费抄几行代码而已。, 我之前做过类似的, 求指点,我正在用地图的service尝试解决]