本文参考了github开源爬虫项目map-easygo,GitHub - liujiao111/map-easygo: 使用python爬取微信宜出行人流量数据

首先是导入相关的库和计算要用到的参数:

import requests
import time
import math

x_pi = 3.14159265358979324 * 3000.0 / 180.0
pi = 3.1415926535897932384626  # π
a = 6378245.0  # 长半轴
ee = 0.00669342162296594323  # 扁率

通过数学计算实现几类坐标的互相转换,封装成函数形式:

def gcj02_to_bd09(lng, lat):
    """
    火星坐标系(GCJ-02)转百度坐标系(BD-09)
    谷歌、高德——>百度
    :param lng:火星坐标经度
    :param lat:火星坐标纬度
    :return:
    """
    z = math.sqrt(lng * lng + lat * lat) + 0.00002 * math.sin(lat * x_pi)
    theta = math.atan2(lat, lng) + 0.000003 * math.cos(lng * x_pi)
    bd_lng = z * math.cos(theta) + 0.0065
    bd_lat = z * math.sin(theta) + 0.006
    return [bd_lng, bd_lat]


def bd09_to_gcj02(bd_lon, bd_lat):
    """
    百度坐标系(BD-09)转火星坐标系(GCJ-02)
    百度——>谷歌、高德
    :param bd_lat:百度坐标纬度
    :param bd_lon:百度坐标经度
    :return:转换后的坐标列表形式
    """
    x = bd_lon - 0.0065
    y = bd_lat - 0.006
    z = math.sqrt(x * x + y * y) - 0.00002 * math.sin(y * x_pi)
    theta = math.atan2(y, x) - 0.000003 * math.cos(x * x_pi)
    gg_lng = z * math.cos(theta)
    gg_lat = z * math.sin(theta)
    return [gg_lng, gg_lat]


def wgs84_to_gcj02(lng, lat):
    """
    WGS84转GCJ02(火星坐标系)
    :param lng:WGS84坐标系的经度
    :param lat:WGS84坐标系的纬度
    :return:
    """
    if out_of_china(lng, lat):  # 判断是否在国内
        return lng, lat
    dlat = _transformlat(lng - 105.0, lat - 35.0)
    dlng = _transformlng(lng - 105.0, lat - 35.0)
    radlat = lat / 180.0 * pi
    magic = math.sin(radlat)
    magic = 1 - ee * magic * magic
    sqrtmagic = math.sqrt(magic)
    dlat = (dlat * 180.0) / ((a * (1 - ee)) / (magic * sqrtmagic) * pi)
    dlng = (dlng * 180.0) / (a / sqrtmagic * math.cos(radlat) * pi)
    mglat = lat + dlat
    mglng = lng + dlng
    return [mglng, mglat]


def gcj02_to_wgs84(lng, lat):
    """
    GCJ02(火星坐标系)转GPS84
    :param lng:火星坐标系的经度
    :param lat:火星坐标系纬度
    :return:
    """
    if out_of_china(lng, lat):
        return lng, lat
    dlat = _transformlat(lng - 105.0, lat - 35.0)
    dlng = _transformlng(lng - 105.0, lat - 35.0)
    radlat = lat / 180.0 * pi
    magic = math.sin(radlat)
    magic = 1 - ee * magic * magic
    sqrtmagic = math.sqrt(magic)
    dlat = (dlat * 180.0) / ((a * (1 - ee)) / (magic * sqrtmagic) * pi)
    dlng = (dlng * 180.0) / (a / sqrtmagic * math.cos(radlat) * pi)
    mglat = lat + dlat
    mglng = lng + dlng
    return [lng * 2 - mglng, lat * 2 - mglat]


def bd09_to_wgs84(bd_lon, bd_lat):
    lon, lat = bd09_to_gcj02(bd_lon, bd_lat)
    return gcj02_to_wgs84(lon, lat)


def wgs84_to_bd09(lon, lat):
    lon, lat = wgs84_to_gcj02(lon, lat)
    return gcj02_to_bd09(lon, lat)

一些基础转换和检查:

def _transformlat(lng, lat):
    ret = -100.0 + 2.0 * lng + 3.0 * lat + 0.2 * lat * lat + \
          0.1 * lng * lat + 0.2 * math.sqrt(math.fabs(lng))
    ret += (20.0 * math.sin(6.0 * lng * pi) + 20.0 *
            math.sin(2.0 * lng * pi)) * 2.0 / 3.0
    ret += (20.0 * math.sin(lat * pi) + 40.0 *
            math.sin(lat / 3.0 * pi)) * 2.0 / 3.0
    ret += (160.0 * math.sin(lat / 12.0 * pi) + 320 *
            math.sin(lat * pi / 30.0)) * 2.0 / 3.0
    return ret


def _transformlng(lng, lat):
    ret = 300.0 + lng + 2.0 * lat + 0.1 * lng * lng + \
          0.1 * lng * lat + 0.1 * math.sqrt(math.fabs(lng))
    ret += (20.0 * math.sin(6.0 * lng * pi) + 20.0 *
            math.sin(2.0 * lng * pi)) * 2.0 / 3.0
    ret += (20.0 * math.sin(lng * pi) + 40.0 *
            math.sin(lng / 3.0 * pi)) * 2.0 / 3.0
    ret += (150.0 * math.sin(lng / 12.0 * pi) + 300.0 *
            math.sin(lng / 30.0 * pi)) * 2.0 / 3.0
    return ret


def out_of_china(lng, lat):
    """
    判断是否在国内,不在国内不做偏移
    :param lng:
    :param lat:
    :return:
    """
    return not (lng > 73.66 and lng < 135.05 and lat > 3.86 and lat < 53.55)

 通过调用百度api获取经纬度,实现地理编码;通过整合上面的计算函数,实现坐标转换

def get_mercator(addr):
    url = 'http://api.map.baidu.com/geocoder/v2/?address=%s&output=json&ak=****************&callback=showLocation' % (addr)
    response = requests.get(url)
    return response.text


def writeline(src, dest):
    count = 0
    ms = open(src, encoding='utf-8')
    num = ms.readlines()
    print(len(num))
    print("-------------------")
    for line in num:
        with open(dest, "a", encoding='utf-8') as mon:
            loc = get_mercator(line)
            try:
                lng_lat = eval(loc[27:-1])["result"]['location']
                print(lng_lat)
                mon.write(str(lng_lat))
            except Exception:
                mon.write('')
            # print(loc)
            # mon.writelines(loc)
            mon.write("\n")
            time.sleep(0.1)
            count += 1
        print("第" + str(count) + "条数据写入成功...")

def coordinate_convert(src,dest):
    count = 0
    ms = open(src, encoding='utf-8')
    num = ms.readlines()
    print(len(num))
    print("-------------------")
    for line in num:
        with open(dest, "a", encoding='utf-8') as mon:
            try:
                lng = float(line.split('	')[0])
                lat = float(line.split('	')[1])
                lng_lat = bd09_to_wgs84(lng, lat)
                print(lng_lat)
                mon.write(str(lng_lat))
            except Exception:
                mon.write('')
            mon.write("\n")
            count += 1

        print("第" + str(count) + "条数据转坐标成功...")

想要根据地址获取经纬度时,仅需把ak替换成自己的,然后运行这段代码。注意这里应当返回的是百度坐标。

import os
os.environ['NO_PROXY']='api.map.baidu.com'
writeline(r"yl_address.txt", r"yl_address_loc.txt")

想要实现坐标转换,直接修改coordinate_convert函数,然后调用即可。

coordinate_convert(r'yiyang_loc_bd.txt',r'yiyang_loc_wgs84.txt')

想要实现逆地理编码,即根据经纬度,反向查询出poi点所在的各级行政区、地名等信息,则需要用到geopy的Nominatim库。注意这里需要经纬度是wgs84的。

import pandas as pd
from geopy.geocoders import Nominatim

df = pd.read_excel("H:/学位论文相关/数据/11月整理/河南省供应链.xlsx")
lat_list = df['纬度']
lng_list = df['经度']
area_list = []
geolocator = Nominatim(user_agent='myuseragent')

for i in range(len(lat_list)):
    location = geolocator.reverse(str(lat_list[i])+","+str(lng_list[i]))
    print(location)
    area_list.append(location)
df['area'] = pd.DataFrame()
df['area'] = area_list
df.to_excel("H:/学位论文相关/数据/11月整理/河南省供应链2.xlsx")

location里面会返回国家名、省名、城市名、区县名、乡镇名和最下一级地名,这一功能非常适合将poi数据整合到行政单元上做统计分析。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐