【Java 进阶篇】使用 Stream 流和 Lambda 组装复杂父子树形结构（List 集合形式）

2024-01-15 17:14 由 Apluemxa 发表于 #后端开发

前言
一、以部门结构为例
二、以省市县结构为例
三、文章小结

前言

在最近的开发中，一星期内遇到了两个类似的需求：返回组装好的部门树、返回组装好的地区信息树，最终都需要返回 List 集合对象给前端。

于是在经过需求分析和探索实践后，我对于这种基于 Stream 和 List 结构的父、子树形结构的操作有了新的认识，现在拿出来和大家作分享交流。

一般来说完成这样的需求大多数人会想到递归，但递归的方式弊端过于明显：方法多次自调用效率很低、数据量大容易导致堆栈溢出、随着树深度的增加其时间复杂度会呈指数级增加等。

核心思路如下：

一次数据库查询全部数据（几万条），其它全是内存操作、性能高；
同时熟练使用 stream 流操作、Lambda 表达式、Java 地址引用，完成组装。

一、以部门结构为例

这里的实体是放在 MySQL 里的，使用简单的封装好的查询语句，这个很简单，剩下的就是内存操作了。

1.1实体

租户表：租户就是一个组织或者公司，所以每个租户都有自己的部门。下面的表结构我只列了一些核心的字段，其它不重要。

@Data
public class PmTenant {
    /**
     * 主键Id
     */
    @TableId(type = IdType.ASSIGN_ID)
    private Long id;
    /**
     * 租户名称
     */
    private String tenantName;
    /**
     * 租户唯一编码，对外暴露
     */
    private String tenantCode;
    /**
     * 租户Id
     */
    private String tenantId;
    /**
     * 租户状态，0可用，1禁用
     */
    private Integer status;
}

部门表：公司里都会有许多的部门，一个部门里还有部门。从最顶层公司到你所在的的部门，可能会有多达六、七层。以下同样只展示核心字段：

@Data
public class PmDept {
    /**
     * 主键id
     */
    @TableId(type = IdType.ASSIGN_ID)
    private Integer id;
    /**
     * 父部门Id
     */
    private Integer parentDeptId;
    /**
     * 部门id，全局唯一，所有系统用
     */
    private Integer deptId;
    /**
     * 部门名称
     */
    private String deptName;
    /**
     * 部门所处的排序
     */
    private Integer orderNum;
    /**
     * 部门所处的层级
     */
    private Integer depth;
    /**
     * 部门状态，0可用，1删除
     */
    private Integer status;
    /**
     * 租户id
     */
    private String tenantId;
    /**
     * 租户编码
     */
    private String tenantCode;
}

1.2返回VO

这个返回的VO是给前端的，里面的子节点集合属性 childrenNodeList ，是一个关键字段，所有该方式返回树结构的 VO 都需要有该字段来”封装自己“。

@Data
public class DeptTreeNodeVO implements Serializable {
    /**
     * 子节点 list 集合，封装自己
     */
    private List<DeptTreeNodeVO> childrenNodeList;
    /**
     * 部门Id
     */
    protected Integer deptId;
    /**
     * 父部门Id
     */
    protected Integer parentDeptId;
    /**
     * 部门名称
     */
    protected String deptName;
}

1.3具体实现

下面直接上代码，注释已经说的比较清楚了：

    @Resource
    private PmTenantService pmTenantService;
    @Resource
    private PmDeptMapper pmDeptMapper;

    @Override
    public List<DeptTreeNodeVO> assembleTree(){
        //租户信息列表，这里是两个租户
        List<PmTenant> tenantList = this.pmTenantService.list();
        //step1：最外层根据租户去组装，有两个租户那么 Stream 就会遍历组装两次；换句话说，如果只有一个租户，就不需要最外层的 Stream
        List<DeptTreeNodeVO> resultList = tenantList.stream().map(tenant -> {
            //注：这里 map 只是简单转换了返回的对象属性（返回需要的类型），本质还是该租户下的所有部门数据
            List<DeptTreeNodeVO> deptTreeNodeVOList = this.selectAllDeptByTenantCode(tenant.getTenantCode())
                    .stream().map(val -> val.convertExt(DeptTreeNodeVO.class)).collect(Collectors.toList());
            //step2：利用父节点分组，即按照该租户下的所有部门的父Id进行分组，把所有的子节点List集合都找出来并一层层分好组
            Map<Integer, List<DeptTreeNodeVO>> listMap = deptTreeNodeVOList.parallelStream()
                    .collect(Collectors.groupingBy(DeptTreeNodeVO::getParentDeptId));
            //step3：关键一步，关联上子部门，将子部门的List集合经过遍历一层层地放置好，最终会得到完整的部门父子关系List集合
            deptTreeNodeVOList.forEach(val -> val.setChildrenNodeList(listMap.get(val.getDeptId())));
            //step4：过滤出顶级部门，即所有的子部门数据都归属于一个顶级父Id
            List<DeptTreeNodeVO> allChildrenList = deptTreeNodeVOList.stream()
                    .filter(val -> val.getParentDeptId().equals(NumberUtils.INTEGER_ZERO)).collect(Collectors.toList());
            //组装最外层关于租户需要的数据，实质已经不是处理部门数据了
            DeptTreeNodeVO node = new DeptTreeNodeVO();
            node.setChildrenNodeList(allChildrenList);
            node.setDeptName(tenant.getTenantName());
            return node;
        }).collect(Collectors.toList());
        return Optional.of(resultList).orElse(null);
    }

    /**
     * 获取某个租户下的所有部门信息
     *
     * @return
     */
    public List<PmDept> selectAllDeptByTenantCode(String tenantCode) {
        return pmDeptMapper.selectList(new LambdaQueryWrapper<PmDept>()
                .eq(PmDept::getTenantCode, tenantCode)
                .eq(PmDept::getStatus, PmDeptStatus.DISABLE.getStatus()));
    }

1.4效果展示

我这里测试的例子是只有三层，数据也没有完全展开，当然五六层也是没问题的。

只要总的部门数据量在一两万条以内（啥情况部门数量会有几万个？部门表一般是独立于其它表的）速度都是比较快的，服务器性能（主要内存给力）好的话，基本整个请求/响应（抛开网络I/O消耗）可以在一秒内完成。

部门树结构效果图

二、以省市县结构为例

这里的实体是放在 MongoDB 里的，不熟悉 MongoDB 也不要紧，这里只需要使用一次查全量的语句。

2.1实体

全国行政区表：全国的行政区包括省/直辖市/自治区、地级市、区/县级市/县这三级，再往下的街道/镇、以及下面的村/小组就不包含了。同样也是只留关键属性：

@Data
public class Region {
    /**
     * 区域id
     */
    @Id
    public Long id;
    /**
     * 父Id
     */
    public Long parentId;
    /**
     * 地区名称
     */
    public String name;
    /**
     * 地区全称
     */
    public String district;
    /**
     * 所属省
     */
    public String province;
    /**
     * 所属地级市
     */
    public String city;
    /**
     * 所属省Id
     */
    public Long provinceId;
    /**
     * 所属地级市Id
     */
    public Long cityId;
    /**
     * 所处层级
     */
    public Integer depth;
}

2.2返回VO

同样，这个里面的子节点集合属性 childrenRegionList，是一个关键字段，所有该方式返回树结构的 VO 都需要有该字段来”封装自己“。

@Data
public class RegionCascadeVO extends RegionVO {
    /**
     * 子节点 list 集合
     */
    private List<RegionCascadeVO> childrenRegionList;
    /**
     * 区域id
     */
    public Long id;
    /**
     * 地区名称
     */
    public String name;
    /**
     * 所处层级
     */
    public Integer depth;
    /**
     * 省
     */
    public String province;
    /**
     * 城市
     */
    public String city;
    /**
     * 地区全称
     */
    public String district;
    /**
     * 父Id
     */
    public Long parentId;
    /**
     * 所属省Id
     */
    public Long provinceId;
    /**
     * 所属地级市Id
     */
    public Long cityId;
}

2.3具体实现

下面同样直接上代码，注释比较详细：

    @Resource
    private RegionRepository regionRepository;

    @Override
    public List<RegionCascadeVO> quickAllTree() {
        //第一步，从数据库中查出所有数据，按照排序条件进行排序，本质上还是这个所有数据的 List 集合
        List<RegionCascadeVO> regionCascadeVOList = this.regionRepository.findAll().stream()
                //注：这里使用 map 映射了需要返回的VO，即相同的属性字段就会转换
                .map(val -> val.convertExt(RegionCascadeVO.class))
                //业务需要的排序规则，使用工具来处理
                .sorted((s1, s2) -> RegionSortUtil.citySort(s1.getName(), s2.getName()))
                .sorted((s1, s2) -> RegionSortUtil.countySort(s1.getName(), s2.getName()))
                .collect(Collectors.toList());
        //第二步，根据父Id 字段进行分组，即所有数据都会按照第一层至最后一层都按照父子关系进行分组；注意，是对所有数据分组
        Map<Long, List<RegionCascadeVO>> listMap = regionCascadeVOList.parallelStream().collect(Collectors.groupingBy(RegionCascadeVO::getParentId));
        //第三步，也是最关键的一步，将父Id下面的所有子数据List集合，经过遍历后都一层层地放置好，最终会得到一个包含父子关系的完整List
        regionCascadeVOList.forEach(val -> val.setChildrenRegionList(listMap.get(val.getId())));
        //第四步，过滤出符合顶层父Id的所有数据，即所有数据都归属于一个顶层父Id
        return regionCascadeVOList.stream().filter(val -> RegionConstant.CHINA_ID.equals(val.getParentId())).collect(Collectors.toList());
    }

2.4效果展示

我这里测试环境的例子是只有省/直辖市/自治区、地级市、区/县级市/县这三级，数据也没有完全展开，当然到下面的镇/街道，乃至村/小组也是没问题的。

这里总的测试数据量是几千条，如果加上镇/街道应该得有几万条，速度也还是是比较快的，服务器性能（主要内存给力）好的话，基本整个请求/响应（抛开网络I/O消耗）可以在一秒内完成。

中国行政区域信息层次结构效果

时间消耗，这里响应只有两百多毫秒，如下图的接口的性能展示：

接口性能展示

原因只有一个：数据库只查一次，把查到的全部数据放内存里，剩下的就是 Stream 的内存操作，都是地址的引用，性能是比较高的。

三、文章小结

使用 Stream 流组装复杂父子树形结构（List 集合形式）的分享到这里就结束了，编码没有捷径，都是项目实践里出真知，一点点摸索攒经验。

如有不足和错误，或者你有更好的解决思路，欢迎大家的指正和交流！

热门相关：暖君布衣官道恶明恶明霍先生结婚吧

Java-并发编程-进阶篇

在上一篇幅中对并发编程进行了简单介绍：并发与并行，进程与线程，以及并发编程的简单代码但是在企业中往往并不能解决实际问题，例如： 1.synchronized关键字在企业开发中会大大降低系统的性能，有什么解决方式，或者其他的替代方案 2.当线程被创建并启动以后，它既不是一启动就进入了执行状态，也不是 ...阅读全文

Mysql进阶篇（二）之索引

# 一. 索引概述 ## 1. 介绍 **索引是帮助MySQL高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。** ![](https://tcs-de ...阅读全文

学习C++这一篇就够了（进阶篇）

内存模型 C++在执行程序的时候，将内存方向划分为4个区域：代码区：存放二进制代码，由操作系统进行管理全局区：存放全局变量、静态变量、常量，程序结束后由操作系统释放栈区：存放函数参数、局部变量，由编译器自动分配和释放堆区：由开发者申请分配和释放，若程序员不释放，程序结束由操作系统自动回收 ...阅读全文

Mysql进阶篇（一）之存储引擎

# 一. MySQL体系结构 ![](https://tcs-devops.aliyuncs.com/storage/112v957e3962f4a8a6d4d8eb1a194d885fa0?Signature=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJBcHB ...阅读全文

[ARM 汇编]进阶篇—异常处理与中断—2.4.2 ARM处理器的异常向量表

#### 异常向量表简介在ARM架构中，异常向量表是一组固定位置的内存地址，它们包含了处理器在遇到异常时需要跳转到的处理程序的入口地址。每个异常类型都有一个对应的向量地址。当异常发生时，处理器会自动跳转到对应的向量地址，并开始执行异常处理程序。 #### 异常向量表的位置 ARM处理器的异常向量表 ...阅读全文

[ARM 汇编]进阶篇—存储访问指令—2.3.3 栈操作指令

栈是一种特殊的数据结构，其特点是后进先出（LIFO，Last In First Out）。在 ARM 汇编中，栈通常用于保存函数调用时的寄存器状态、局部变量和返回地址等。本节将详细介绍 ARM 汇编中的栈操作指令，并通过实例帮助你更好地理解和掌握这些指令。 1. 推入栈（PUSH） PUSH 指令用 ...阅读全文

[ARM 汇编]进阶篇—存储访问指令—2.3.2 多数据传输指令

在 ARM 汇编中，多数据传输指令用于一次性从存储器中加载多个数据到寄存器组，或将寄存器组中的多个数据存储到存储器。这些指令通常用于高效地处理数组、结构体等数据结构。在本节中，我们将详细介绍 ARM 汇编中的多数据传输指令，并通过实例帮助你更好地理解和掌握这些指令。 1. 加载多个数据到寄存器组（L ...阅读全文

[ARM 汇编]进阶篇—异常处理与中断—2.4.1 异常处理概念

#### 异常处理简介在ARM汇编开发中，异常处理和中断是常见的概念，它们是对系统运行过程中出现的特殊情况进行处理的一种机制。异常处理和中断包括硬件异常、软件异常和外部中断等。当处理器遇到这些特殊情况时，它会自动执行相应的处理程序。 #### 异常和中断的分类 1. **复位（Reset）**：当 ...阅读全文

iOS开发之进阶篇（1）—— 证书、打包上架流程、p12文件

iOS开发相关的证书有很多种，iOS开发证书（iOS App Development）、iOS发布证书（iOS Distribution (App Store and Ad Hoc)）、网站推送ID证书（Website Push ID Certificate）、Apple Pay付款处理证书（App ...阅读全文