题目描述
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
输入:
输入一个string型基因序列,和int型子串的长度
如
AACTGTGCACGACCTGA
5
输出:
找出GC比例最高的字串
这个题目还是比较简单的,但是题目描述的比较含糊,我测试之后发现,他的测试用例没有出现一些特殊的情况比如:有不止一个GC比例最高的字串,或者没有任何子串中包含GC
以下是我使用Java代码的具体实现:
import java.util.Scanner;
public class Main {
public static void main(String[] args){
Scanner scanner=new Scanner(System.in);
String DNA=scanner.nextLine();
int len=DNA.length();
int N=scanner.nextInt();
int[] count=new int[len-N+1];
scanner.close();
for (int i = 0; i <= len-N; i++) {
for (int j = i; j < i+N; j++) {
if ('C'==DNA.charAt(j)||'G'==DNA.charAt(j)) {
count[i]+=1;
}
}
}
int max=count[0];
int k=0;
for (int i = 1; i < count.length; i++) {
if (count[i]>max) {
max=count[i];
k=i;
}
}
System.out.print(DNA.substring(k, k+N));
}
}
标记为原创的博文均为本人辛苦码字所得,谢绝抄袭,转载请注明出处,新浪微博私信艾特:物联网工程_Niegang。