PySAL做空间统计?莫兰指数怎么算?
“我的莫兰指数跑出来是NaN!”——你不是一个人
上周一位在读研的读者私信我:“Dr. Gis,我用PySAL算莫兰指数,结果全是NaN,导师说数据没问题,我快崩溃了……” 这种情况太常见了。空间自相关分析是GIS进阶必经之路,但莫兰指数(Moran’s I)就像个傲娇的学霸——你稍不注意格式、权重或缺失值,它就给你脸色看。

我在参与某省城市群经济集聚分析项目时,第一次跑莫兰指数也报错。后来发现是行政区划边界重叠导致邻接矩阵异常——这锅不能甩给PySAL,是我们没理解它的“脾气”。
莫兰指数到底在算什么?类比“朋友圈点赞分布”
想象你发了一条朋友圈,朋友们分布在不同城市。如果高赞的朋友都集中在北上广深,低赞的都在三四线——这就是正空间自相关:相似值扎堆。反之,如果高赞和低赞朋友随机混居,就是无空间自相关。莫兰指数就是量化这种“扎堆程度”的指标,取值范围[-1, 1]:
- +1:完美聚集(富人区挨着富人区)
- 0:完全随机(房价高低全靠掷骰子)
- -1:完美分散(富人故意住穷人隔壁)
实际中很少出现极端值,通常 |I| > 0.3 就算有显著聚集性了。
PySAL实战四步走:从CSV到P值
我们以“中国340个城市GDP数据”为例,手把手教你避开所有坑。假设你的数据是cities.csv,包含city_name, gdp, geometry(WKT格式)三列。
Step 1:安装与导入——别被依赖库劝退
pip install pysal libpysal geopandas contextily
PySAL生态庞大,我们只装核心模块。Geopandas处理空间数据,Contextily加底图——毕竟结果得看得见才安心。
Step 2:构建空间权重矩阵——定义“谁是谁的邻居”
import geopandas as gpd
from libpysal.weights import Queen
df = gpd.read_file('cities.csv')
# 用Queen邻接(共享边即邻居),也可选Rook或KNN
w = Queen.from_dataframe(df)
# 检查连通性!这是NaN错误的元凶
print(w.islands) # 输出孤立要素ID,必须为空或手动处理
⚠️ 关键点:如果w.islands不为空,说明某些城市被孤立(比如海岛市),需用KNN或手动赋权重,否则莫兰指数必出NaN。
Step 3:计算莫兰指数——一行代码的魔法
from esda.moran import Moran
moran = Moran(df['gdp'], w)
print(f"莫兰指数 I = {moran.I:.4f}")
print(f"P值 = {moran.p_sim:.4f}") # 蒙特卡洛模拟P值更稳健
输出示例:I = 0.4271, P = 0.001 —— 强烈拒绝随机假设,GDP存在显著空间聚集!
Step 4:可视化诊断——莫兰散点图+LISA聚类
import matplotlib.pyplot as plt
from splot.esda import moran_scatterplot, lisa_cluster
fig, ax = plt.subplots(1, 2, figsize=(12, 5))
moran_scatterplot(moran, ax=ax[0])
lisa_cluster(moran, df, ax=ax[1])
ax[0].set_title('莫兰散点图:横轴自身,纵轴邻居均值')
ax[1].set_title('LISA聚类:HH=高-高聚集, LL=低-低聚集')
plt.show()
左图看全局模式,右图锁定热点区(比如长三角HH集群)。这才是老板/导师想看到的交付物!
避坑指南:三个高频报错的解药
| 错误现象 | 根本原因 | 解决方案 |
|---|---|---|
| I = NaN | 权重矩阵含孤立单元 | 改用KNN权重或删除islands |
| P值=1.0 | 蒙特卡洛模拟次数不足 | 增加参数permutations=9999 |
| 散点图无趋势 | 变量未标准化或空间尺度错配 | 对数变换GDP,检查投影坐标系 |
总结:莫兰指数不是终点,而是空间思维的起点
PySAL把复杂的矩阵运算封装成简单接口,但背后的空间关系逻辑必须吃透。记住这个链条:定义邻居 → 构建权重 → 计算相关 → 显著性检验 → 可视化归因。下次遇到NaN,先查w.islands;遇到不显著,先怀疑空间尺度是否合理。
你在用PySAL时踩过哪些坑?或者对LISA聚类图有疑问?**评论区留下你的报错截图或代码片段,我来帮你debug!** 下期我们拆解Geoda与PySAL结果差异之谜。
-
GIS坐标系总是搞混?各行业投影选择与WGS84、CGCS2000转换实战技巧(含:对照表) 2026-01-14 08:30:02
-
GIS坐标系位置总对不上?三步搞定数据偏移修正(附:参数对照表) 2026-01-14 08:30:02
-
GIS坐标系6位转8位总出错?核心算法与精度提升技巧详解(附:参数对照表) 2026-01-14 08:30:02
-
GIS坐标系转换为何总出错?常见误区排查与修正方案(附:对照表) 2026-01-13 08:30:02
-
GIS坐标系转换总出错?核心参数与校正流程详解(附:参数表) 2026-01-13 08:30:02
-
GIS坐标系怎么设置?从定义到投影转换的实战指南(附:参数对照表) 2026-01-13 08:30:02
-
GIS坐标系到底用哪个?盘点国内主流坐标系及转换技巧(附:参数表) 2026-01-13 08:30:02
-
GIS坐标系转换工具怎么选?高精度投影转换实战技巧(附:对照表) 2026-01-13 08:30:02
-
GIS坐标系到底怎么选?一文搞懂投影与转换(含:常用参数表) 2026-01-13 08:30:02
-
GIS坐标系与投影傻傻分不清?GIS中地理坐标系转投影坐标系实战指南(含:常用投影参数表) 2026-01-13 08:30:01
-
GIS坐标系与投影总是报错?ArcGIS坐标定义与转换参数详解(附:对照表) 2026-01-13 08:30:01
-
GIS坐标系与投影总报错?地理坐标系和投影坐标系的核心区别(含:转换公式) 2026-01-13 08:30:01
-
WGS84坐标系转换CGCS2000总出错?原理剖析与实战转换步骤(附:常用GIS软件参数表) 2026-01-13 08:30:01
-
ArcGIS地理坐标系和投影坐标系有何区别?一文读懂核心差异与转换技巧(含:实战案例) 2026-01-12 08:30:02
-
ArcGIS坐标系选择总出错?一文搞懂GIS地理坐标与投影转换(附:常用参数对照表) 2026-01-12 08:30:02
-
WGS84坐标系如何正确选择投影?常用GIS投影坐标系推荐(含:EPSG代码与参数) 2026-01-12 08:30:02
-
GIS投影后坐标没变化?定义坐标系与投影工具使用误区详解(附:对照表) 2026-01-12 08:30:02
-
GIS投影总报错?WGS84转CGCS2000实战步骤与参数详解(附:坐标系对照表) 2026-01-12 08:30:02
-
GIS投影坐标总是偏移?一分钟搞定坐标系定义与转换(附:高精度参数表) 2026-01-12 08:30:02
-
GIS坐标系与投影总出错?盘点常见投影变形问题与修正方案(附:WGS84与CGCS2000转换参数表) 2026-01-12 08:30:02