字符串相关处理

时间:2023-01-31 19:51:41
“氨基糖苷类和第一代头孢菌素注射剂合用可能加重前者的肾毒性,应注意监测肾功能”
”有青霉素类过敏史的患者确有应用头孢哌酮/舒巴坦的指征时,必须在严密观察下慎用,但有青霉素过敏性休克史的患者,不可选用头孢哌酮/舒巴坦“

我需要写一个程序将上面两句话变成下面的句子

“氨基糖苷类和第一代头孢菌素注射剂合用可能加重前者的肾毒性”
“氨基糖苷类和第一代头孢菌素注射剂合用应注意监测肾功能”
“有青霉素类过敏史的患者确有应用头孢哌酮/舒巴坦的指征时,必须在严密观察下慎用”
“但有青霉素过敏性休克史的患者,不可选用头孢哌酮/舒巴坦“

需要处理的有很多句子,所以感觉用if函数,则无用的代码太多,希望哪位做过的高手帮帮忙

12 个解决方案

#1


找规律    说说有什么规律   直接给一段字符串  说明不了问题

#2


这是根据语义来分割啊?

#3


引用 2 楼 cumtwyc 的回复:
这是根据语义来分割啊?


一下提高了超多难度...一点不会..
但是这种好像要找规律也很难

#4


这是啥处理规则?业务性太强了吧

#5


给一段字符,业务逻辑也顺便给出来啊,不然谁知道呢

#6


引用 1 楼 sui2121 的回复:
找规律    说说有什么规律   直接给一段字符串  说明不了问题

有很多字符串,我自己也没有找到规律呀,要是找到规律了就直接写程序了呢 字符串相关处理
因为中文的表述太多了

#7


引用 2 楼 cumtwyc 的回复:
这是根据语义来分割啊?

恩呢,我做的就是医学指南的语义分析,直接将医学指南作为输入,输出为RDF三元组
但前期处理大多与字符串处理有关,需要将句子进行分割,但中文表述太多样了,我根本不知道该怎样进行分割呢

#8


引用 3 楼 scmod 的回复:
Quote: 引用 2 楼 cumtwyc 的回复:

这是根据语义来分割啊?


一下提高了超多难度...一点不会..
但是这种好像要找规律也很难

恩呀,所以一直没什么进展,这个问题都做了差不多1个多月了 字符串相关处理

#9


引用 7 楼 noever123 的回复:
Quote: 引用 2 楼 cumtwyc 的回复:

这是根据语义来分割啊?

恩呢,我做的就是医学指南的语义分析,直接将医学指南作为输入,输出为RDF三元组
但前期处理大多与字符串处理有关,需要将句子进行分割,但中文表述太多样了,我根本不知道该怎样进行分割呢

根据主谓宾结构分析句子,把常见的主语、谓语、宾语建立字典树,然后查找分析,如果有完整的主谓宾直接提取,如果缺少宾语,则分析下一句,不过精确度还是不好保证,还需要一些其他的知识。

#10


引用 9 楼 cumtwyc 的回复:
Quote: 引用 7 楼 noever123 的回复:

Quote: 引用 2 楼 cumtwyc 的回复:

这是根据语义来分割啊?

恩呢,我做的就是医学指南的语义分析,直接将医学指南作为输入,输出为RDF三元组
但前期处理大多与字符串处理有关,需要将句子进行分割,但中文表述太多样了,我根本不知道该怎样进行分割呢

根据主谓宾结构分析句子,把常见的主语、谓语、宾语建立字典树,然后查找分析,如果有完整的主谓宾直接提取,如果缺少宾语,则分析下一句,不过精确度还是不好保证,还需要一些其他的知识。

但是中文表述很随意呀,很多没有主谓宾的句子也是我研究需要呀,我需要最终将句子处理成下面的样子
<eventPrecondition>氨基糖苷类和第一代头孢菌素注射剂合用</eventPreconditon>
<eventOperator>应该</eventOperator>
<event>注意监测肾功能</event>
想过用正则表达式,但中间的eventOperator也有很多变化

#11


有时间再帮你想一下吧,肯定很复杂。你是研究生?

#12


引用 11 楼 cumtwyc 的回复:
有时间再帮你想一下吧,肯定很复杂。你是研究生?

恩呢,多谢你哈 字符串相关处理
但貌似可以用正则表达式先把结构弄出来,我先试一下哈

#1


找规律    说说有什么规律   直接给一段字符串  说明不了问题

#2


这是根据语义来分割啊?

#3


引用 2 楼 cumtwyc 的回复:
这是根据语义来分割啊?


一下提高了超多难度...一点不会..
但是这种好像要找规律也很难

#4


这是啥处理规则?业务性太强了吧

#5


给一段字符,业务逻辑也顺便给出来啊,不然谁知道呢

#6


引用 1 楼 sui2121 的回复:
找规律    说说有什么规律   直接给一段字符串  说明不了问题

有很多字符串,我自己也没有找到规律呀,要是找到规律了就直接写程序了呢 字符串相关处理
因为中文的表述太多了

#7


引用 2 楼 cumtwyc 的回复:
这是根据语义来分割啊?

恩呢,我做的就是医学指南的语义分析,直接将医学指南作为输入,输出为RDF三元组
但前期处理大多与字符串处理有关,需要将句子进行分割,但中文表述太多样了,我根本不知道该怎样进行分割呢

#8


引用 3 楼 scmod 的回复:
Quote: 引用 2 楼 cumtwyc 的回复:

这是根据语义来分割啊?


一下提高了超多难度...一点不会..
但是这种好像要找规律也很难

恩呀,所以一直没什么进展,这个问题都做了差不多1个多月了 字符串相关处理

#9


引用 7 楼 noever123 的回复:
Quote: 引用 2 楼 cumtwyc 的回复:

这是根据语义来分割啊?

恩呢,我做的就是医学指南的语义分析,直接将医学指南作为输入,输出为RDF三元组
但前期处理大多与字符串处理有关,需要将句子进行分割,但中文表述太多样了,我根本不知道该怎样进行分割呢

根据主谓宾结构分析句子,把常见的主语、谓语、宾语建立字典树,然后查找分析,如果有完整的主谓宾直接提取,如果缺少宾语,则分析下一句,不过精确度还是不好保证,还需要一些其他的知识。

#10


引用 9 楼 cumtwyc 的回复:
Quote: 引用 7 楼 noever123 的回复:

Quote: 引用 2 楼 cumtwyc 的回复:

这是根据语义来分割啊?

恩呢,我做的就是医学指南的语义分析,直接将医学指南作为输入,输出为RDF三元组
但前期处理大多与字符串处理有关,需要将句子进行分割,但中文表述太多样了,我根本不知道该怎样进行分割呢

根据主谓宾结构分析句子,把常见的主语、谓语、宾语建立字典树,然后查找分析,如果有完整的主谓宾直接提取,如果缺少宾语,则分析下一句,不过精确度还是不好保证,还需要一些其他的知识。

但是中文表述很随意呀,很多没有主谓宾的句子也是我研究需要呀,我需要最终将句子处理成下面的样子
<eventPrecondition>氨基糖苷类和第一代头孢菌素注射剂合用</eventPreconditon>
<eventOperator>应该</eventOperator>
<event>注意监测肾功能</event>
想过用正则表达式,但中间的eventOperator也有很多变化

#11


有时间再帮你想一下吧,肯定很复杂。你是研究生?

#12


引用 11 楼 cumtwyc 的回复:
有时间再帮你想一下吧,肯定很复杂。你是研究生?

恩呢,多谢你哈 字符串相关处理
但貌似可以用正则表达式先把结构弄出来,我先试一下哈