贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

时间:2022-11-20 14:04:59

哈夫曼树

1.概念:

  • 给定n个权值最为n个叶子的节点,构建成一颗二叉树。如果次树的带权路径长度最小,则称此二叉树为最优二叉树,也叫哈夫曼树。
  • WLP带权路径长度
    • 公式:
      贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

    • Wk:第k个叶子的节点权值

    • Lk:根节点到第k个叶子的节点长度

例如下列二叉树:

  • 给定4个叶子节点,权值分别为{2,3,5,8},可以构造出4中形状不同的二叉树,但它们的带权路径长度可能不同。
贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

如上图可看出:1、最后两个树的带权路径长度相同且也是最小的,所以可看作哈夫曼树

2、权值最小的节点越靠下,越大越靠近根节点

2.构建哈夫曼树

(1)、在{2,3,5,8}这几个节点看作叶子节点(即后面没有子节点)

贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

(2)、在这几个节点中选出权值最小和次小的两个节点。构成一个新二叉树(最小为左字节的、次小为右子节点),新二叉树的权值为这两个权值之和.

贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

(3)、删除已经使用过的节点。将新创建的节点加入到还没被使用过的节点集合中,找出最小和次小的节点权值。又构成一颗新的二叉树。

贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

(4)、重复(2)的操作

贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

(5)、重复上面操作:删除已使用的节点,将新的节点加入未使用节点的集合中,发现只有一个节点,其权值为18.则此哈夫曼树创建完成,根节点权值为18.

代码如下:


import java.util.ArrayList;
import java.util.Collections;
import java.util.List;

/**
 * 构造哈夫曼树
 */
public class test1 {
    public static void main(String[] args) {
        int[] arr={2,3,5,8};
        //调用自定义的哈夫曼树方法,生成哈夫曼树
        hafmantree(arr);
    }

    /**
     * ,构造哈夫曼数方法
     *
     * @param arry
     */
    public static void hafmantree(int[] arry) {
        //创建集合用于存放节点值
        List<Node> nlis = new ArrayList<Node>();
        //遍历集合
        for (int value : arry) {
            //将每个数组元素看作Node节点对象,并存入list集合内
            nlis.add(new Node(value));
        }
       /*
       由于集合中存入的是一个个的Node对象,而Node对象已经被我们声明成了按照从小到大的可排序对象。
       所以这里我们为可以通过Collections工具类中的sort方法进行排序
        */
        //循环条件:只有一个节点,即最终根节点
        while (nlis.size() > 1) {
            Collections.sort(nlis);
            //查看集合中还未被使用的节点
            System.out.println(nlis);
            //到了这里说明集合中的所有节点(权值)都是按照从小到大的顺序
            //获取最小的节点值(二叉树左节点):子节点
            Node lileft = nlis.get(0);
            //获取第2小的节点值(二叉树右节点):子节点
            Node lireght = nlis.get(1);
       /*创建新的Node节点对象(二叉树):
            此节点对象是最小的两个节点之和所生成的最新的节点。三个节点可以看成一个二叉树,即:
             根节点(insternode对象)、左子节点(lileft.value)、右子节点(lireght.value)
        */
            Node insternode = new Node(lileft.value + lireght.value);
            //此二叉树的左节点
            insternode.left = lileft;
            //此二叉树的右节点
            insternode.right = lireght;
            //删除已经被处理过的节点
            nlis.remove(lileft);
            nlis.remove(lireght);
            //将最新的节点加入到list集合中
            nlis.add(insternode);
            //重新对最新的list数组进行排序
            Collections.sort(nlis);
        }
        //查看最终根节点
        System.out.println(nlis);
    }


}


/**
 * ,构造哈夫曼数节点类,
 * 此类也可以看成一个二叉树:根节点(Node对象)、左节子点(left)、右字节点(right)
 * 实现Comparable接口:说明此类是可通过Collections工具类排序的,
 */
class Node implements Comparable<Node> {
    int value;  //每个节点的值(权值)
    Node left;   //每个二叉树的左指向节点
    Node right;   //每个二叉树的右指向节点

    //构造方法,这里只需要初始化value实例变量,用于对象的赋值,而 left 与 right 本身就是此对象,可直接用于value赋值
    public Node(int value) {
        this.value = value;
    }

    @Override
    public String toString() {
        return "Node{" +
                "value=" + value +
                '}';
    }

    //支持从小到大排序
    @Override
    public int compareTo(Node o) {
        return this.value - o.value;
    }
}

结果:

贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

3.构建哈夫曼编码

  • 这里是对一段字符串进行哈夫曼编码,所以需要先处理字符串

  • 在哈夫曼树的基础上,规定了路径编码。

  • 遍历已经创建好了的哈夫曼树,从它的根节点遍历次树到叶子节点,左子路径编码:0 、右子路径编码:1


import java.util.*;

/**
 * 构造哈夫曼数+生成哈夫曼编码,编程实现。
 */
public class test1 {
    public static void main(String[] args) {
        //需要转换为哈夫曼编码的字符串
        String valus="asdsgddbhj ,sjsh";
        //将字符串存以node对象存入list集合中
        List<Node> list = ListAndNode(valus);
        //生成哈夫曼树
        Node node = HFMTree(list);
        //得到哈夫曼编码
        HFMTable(node,"",andindex);
        System.out.println(yezijied);   //{32=1010, 97=1011, 98=1100, 115=01, 100=111, 103=1101, 104=001, 106=100, 44=000}

    }

/*
第四步:
创建哈夫曼编码表:将叶子节点以0、1表示。0===》向左子节点走。1===》向右子节点走
    yezijied:存放叶子节点对应的哈夫曼编码。此集合作业与全局
    andindex:拼接编码。(拼接对应的0或1,形参最终的哈夫曼编码)
 */

    static Map<Byte,String> yezijied=new HashMap<>();
    static  StringBuilder andindex=new StringBuilder();

    /**
     *
      * @param node:节点
     * @param index:路径表示:左路径为0.右路劲为1
     * @param sub:拼接路径,使其成为对应叶子节点的哈夫曼码
     */
public static void HFMTable(Node node,String index,StringBuilder sub){
    //
    StringBuilder gitindex=new StringBuilder(sub);
    //拼接路径
    gitindex.append(index);
    //如果节点为空就不需要处理
    if (node!=null) {
        //如果当前节点不是叶子节点
        if (node.value == null) {
            //如果节点不为空就递归其左边节点。并设置向左为0
            HFMTable(node.left, "0", gitindex);
            //如果节点不为空就递归其右边节点。并设置向右为1
            HFMTable(node.right, "1", gitindex);
        } else {
            //为叶子节点就将其存入map集合中
            yezijied.put(node.value, gitindex.toString());
        }

    }
}

    /*
    第三步:
    @param nodes:已经存入list集合中的Node节点
    创建字符串的哈夫曼树结构
     */
    public static Node HFMTree(List<Node> nodes){
        //循环条件:节点数必须大于1.如果等于1就是一个节点(根节点),没有分支
        while (nodes.size()>1){
            //排序list集合,根据权值(节点个数)从小到大排序
            Collections.sort(nodes);

            /*
            创建一个二叉树:
            feiyezijied:根节点
            nodeleft:左子节点
            noderight:右子节点
             */
            //得到权值最小的两个节点.这两个节点分别可看作左右两个子节点
            Node nodeleft = nodes.get(0);
            Node noderight = nodes.get(1);
            //创建新的Node对象:这可以想象为两个叶子节点生成的根节点,
            // 由于哈夫曼数的原理,需要编码的值是叶子节点,而叶子节点上的父节点只是通过叶子节点虚拟创建的节点,
            // 是为了形成一整颗完整的树。所以它是没有字符串原始值,,其可用两个字节的权值之和标记
            Node feiyezijied=new Node(null,nodeleft.quanzhi+noderight.quanzhi);
            //Node对象的左字节点
            feiyezijied.left=nodeleft;
            //Node对象的右字节点
            feiyezijied.right=noderight;

            //删除原集合中的以使用的节点对象.即上面已经每次获得的集合中两个最小的节点
            nodes.remove(nodeleft);
            nodes.remove(noderight);

            //将新创建的Node节点加入list集合中
            nodes.add(feiyezijied);
            //重新对list集合排序
            Collections.sort(nodes);
        }
        //返回最终根节点
        return nodes.get(0);
    }



    /*
    第二步:
    @param valus:传入需要编码的字符串,将其变成节点
    将需要编码的字符串,每个原始值(ASCIIM码)以节点(Node)对象形式传入list集合中。
    而节点对象Node初始化了value与quanzhi,所以节点对象是包括这两个值,所以将每个节点对象当作一个map.
    设k=value、v=quanzhi
     */
    public static List<Node> ListAndNode(String valus){
        //将字符对象存入byte数组。
        byte[] bytes = valus.getBytes();
        //创建List集合
        List<Node> nodes=new ArrayList<>();
        //创建Map集合
        Map<Byte,Integer> node=new HashMap<>();
        //遍历bytes数组,得到每个字符串的原始值
        for (byte by:bytes){
            //先试着通过传入的第一个k获取v
            Integer index = node.get(by);
            //如果map集合中此原始值对应的个数还没有
            if (index==null){
                node.put(by,1);
            }else {
                node.put(by,index+1);
            }
        }
        //遍历map集合,并将每次遍历的元素,以Node对象的形式存入list集合
        for (Map.Entry<Byte,Integer> n:node.entrySet()){
            nodes.add(new Node(n.getKey(),n.getValue()));
        }
        //最后返回此list集合
        return nodes;
    }

}

  /*
  第一步:
    节点类:其本身可可看作一个概念性的二叉树
    Node对象本身可看作是一个二叉树的根节点
    实现Comparable接口:泛型规定此接口作用与此Node节点,说明此类是可排序的,通过' Collections.sort()'
     */

class Node implements Comparable<Node>{
    Byte value;     //原始值:字符本身的ASCIIM码。因为一段字符串中有许多相同的字符,但相同字符却对应这一个ASCIIM码
    int quanzhi;    //此字符value在一段字符串中出现的次数
    Node left;      //Node对象看作是二叉树的根节点,那么这就是此二叉树的左子节点
    Node right;     //Node对象看作是二叉树的根节点,那么这就是此二叉树的右边子节点

    //构造器初始化 value 、quanzhi。
    public Node(Byte value, int quanzhi) {
        this.value = value;
        this.quanzhi = quanzhi;
    }

    //重写toString:因为我们需要拿到这两个值
    @Override
    public String toString() {
        return "Node{" +
                "value=" + value +
                ", quanzhi=" + quanzhi +
                '}';
    }

    //实现Comparable接口中的方法:手动设置排序规则
    @Override
    public int compareTo(Node o) {
        //设置为通过权值从小到大排序
        return    this.quanzhi-o.quanzhi;
    }

    //前序遍历
    public void qxbl(){
        //先输出当前节点,也就是根节点
        System.out.println(this);
        //如果左子节点不是null节点,就递归遍历输出左子节点.null表示不是叶子节点
        if (this.left!=null){
            this.left.qxbl();
        }
        //同样递归右子节点
        if (this.right!=null){
            this.right.qxbl();
        }
    }
}