Java编程通过匹配合并数据实例解析（数据预处理）

本文研究的主要是java编程通过匹配合并数据（数据预处理）的相关内容，具体如下。

数据描述

以下程序是对如下格式的数据进行合并处理。

这个表的每一行表示用户id及用户的特征。其中，一个用户只有一个特征向量，即第一列不会重复。

Java编程通过匹配合并数据实例解析（数据预处理）

这张表的第一列，表示用户的id，第二列表示用户所看的电影，第三列表示用户对电影的打分（1-13分），第四列表示用户对电影的打分，但分值范围是1-5分。

问题描述

在做数据预处理时，如何将第二张表添加上用户特征呢？其实，方法很简单，将第二张表的用户id与第一张表的用户id进行匹配就行。合并结果如下图所示。

Java编程通过匹配合并数据实例解析（数据预处理）

数据处理程序

									package deal;

									import java.io.bufferedreader;

									import java.io.file;

									import java.io.fileinputstream;

									import java.io.ioexception;

									import java.io.inputstreamreader;

									import java.math.bigdecimal;

									import java.util.arraylist;

									import java.util.hashmap;

									import java.util.list;

									/*

									 * author:合肥工业大学 管院学院 钱洋 

									 * email：1563178220@qq.com

									*/

									public class getpuser {

									    public static list<string> readdocs(string docspath,string code) throws ioexception{

									        bufferedreader reader = new bufferedreader( new inputstreamreader( new fileinputstream( new file(docspath)),code));

									        string s=null;

									        list<string> userproductscore=new arraylist<string>();

									        while ((s=reader.readline())!=null) {

									            userproductscore.add(s);

									        }

									        reader.close();

									        return userproductscore;

									    }

									    public static hashmap<string, string> mapread(string docspath1,string code1) throws ioexception{

									        bufferedreader reader1 = new bufferedreader( new inputstreamreader( new fileinputstream( new file(docspath1)),code1));

									        string s1=null;

									        hashmap<string,string> userfeaturemap=new hashmap<string,string>();

									        while ((s1=reader1.readline())!=null) {

									            string arr[]=s1.split("\t");

									            string feature="";

									            for (int i = 1; i < arr.length; i++) {

									                bigdecimal db = new bigdecimal(arr[i]);

									                string ii = db.toplainstring();

									                feature+=ii+" ";

									            }

									            userfeaturemap.put(s1.split("\t")[0], feature);

									        }

									        reader1.close();

									        return userfeaturemap;

									    }

									    public static list<string> match(list<string> userproductscore,hashmap<string, string> userfeaturemap) throws ioexception{

									        list<string> userscoreandfeature=new arraylist<>();

									        for (int i = 0; i < userproductscore.size(); i++) {

									            //获取用户id

									            string user_id=userproductscore.get(i).split("\t")[0];

									            //获取用户特征

									            string userfeature = userfeaturemap.get(user_id);

									            userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature);

									            system.out.println(userproductscore.get(i)+"\t"+userfeature);

									        }

									        return userscoreandfeature;

									    }

									    public static void main(string[] args) throws ioexception {

									        //读取两个文本

									        list<string> userproductscore=readdocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk");

									        hashmap<string, string> userfeaturemap=mapread("data/fileofuser/yahoo.txt","utf-8");

									        //匹配结果

									        match(userproductscore,userfeaturemap);

									    }

									}

总结

以上就是本文关于java编程通过匹配合并数据实例解析（数据预处理）的全部内容，希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题，如有不足之处，欢迎留言指出。感谢朋友们对本站的支持！

原文链接：http://blog.csdn.net/qy20115549/article/details/59110167

秒客网

Java编程通过匹配合并数据实例解析（数据预处理）

相关文章