pyproj运行效率优化

介绍

pyproj是一个常用的地理坐标转换python库,它其实是对proj库的python封装,底层调用proj这个c++库。当我们对大规模地理数据执行坐标转换时,需要尽可能提高pyproj的运行效率,否则会浪费大量时间。下面介绍一些常用的方法,可有效提高pyproj运行效率。

方法

首先import pyproj

import pyproj
from pyproj import Transformer

这里以WSG84地理坐标转UTM北纬51分带投影坐标为例

EPSG_WGS84 = 4326
EPSG_WGS84_UTM_51N = 32651

1. 使用全局变量

使用下面的函数每次执行坐标转换都会new一个transformer对象,函数运行结束则销毁对象并回收内存,内存不断重复分配与回收对程序运行效率影响较大。

def lonlat_to_xy(lon, lat, epsg=EPSG_WGS84_UTM_51N):
    """
    输入经度和纬度,返回x和y(单位:m)
    """

    transformer = Transformer.from_crs("epsg:{}".format(EPSG_WGS84), "epsg:{}".format(target_epsg), always_xy=True)
    return transformer.transform(lon, lat)

我们使用全局变量来避免这一问题。全局变量初始化可以设置area_of_interest参数,含义为当前所关注的坐标经纬度范围,能进一步提高计算效率。

DEFAULT_TRANS = Transformer.from_crs("epsg:{}".format(EPSG_WGS84), "epsg:{}".format(EPSG_WGS84_UTM_51N), always_xy=True,
                                area_of_interest=AreaOfInterest(119.504167, 31.093677, 120.610871, 32.005928))

def lonlat_to_xy(lon, lat, epsg):
    if epsg == EPSG_WGS84_UTM_51N:
        return DEFAULT_TRANS.transform(lat, lon)
    transformer = Transformer.from_crs("epsg:{}".format(EPSG_WGS84), "epsg:{}".format(epsg))
    return transformer.transform(lon, lat)

2. 开启gloabal_context

如果代码确定为单线程执行,可以设置global_context为true。

pyproj.set_use_global_context(active=True)

3. 批量计算,少用循环

直接输入坐标数组批量计算,不要在循环体内对单个点进行坐标转换。

lngs = [119.50, 119.51, 119.52, 119.49, 119.50]
lats = [31.09, 31.10, 31.08, 31.00, 31.04]
xx, yy = lonlat_to_xy(lngs, lats, EPSG_WGS84_UTM_51N)

参考

热门相关:峡谷正能量   大妆   大妆   异世修真邪君   今天也没变成玩偶呢