基础吃透 BGP EVPN VXLAN 完整学习路线(从看懂原理→独立搭环境→排生产故障)
先给你拆解你懵的核心根源:
二层 VXLAN、三层 VXLAN、集中式 / 分布式网关混在一起讲,没有分层拆解,逻辑顺序颠倒。
下面分 4 阶段循序渐进,不用死记硬背,每一步配实操 + 区分概念,学完能独立交付、排查故障。
阶段 1:先补齐前置基础(看不懂 EVPN 的根本原因)
BGP EVPN VXLAN 是「VXLAN 隧道 + EVPN 控制面 + BGP 路由协议」三者结合,缺任何一块都会懵,先逐个补:
1)VXLAN 基础(只解决:什么是二层 VXLAN)
- 核心定义:VXLAN 是三层 IP 网络上承载二层以太网帧的隧道技术,VNI 替代传统 VLAN,解决机房 VLAN 4094 上限不足。
- 必须吃透 3 个基础组件:
- VTEP:隧道端点(你的 S5820V2/S9850 leaf 交换机);
- VNI:虚拟网段 ID(对应传统 VLAN,1~16777215);
- Underlay:底层承载路由(VTEP 之间互通的三层网络,OSPF/IS-IS);
- Overlay:VXLAN 虚拟二层业务网络。
- 传统静态 VXLAN 痛点(引出 EVPN 存在的意义):
静态 VXLAN 需要手动配置所有对端 VTEP IP,机房扩容新增 leaf 就要所有设备改配置,无法大规模部署;EVPN 就是用来自动同步终端 MAC、VTEP、网关路由,替代手工配置。
- 实操小实验(HCL 模拟器搭 2 台 leaf)
仅做静态 VXLAN,只实现跨设备同 VNI 二层互通,不用 BGP,先感受纯二层 VXLAN 转发逻辑,理解报文封装:内层二层帧 + VXLAN 头 + 外层 Underlay IP。
2)EVPN 基础(解决:为什么要用 BGP EVPN,EVPN 是什么)
EVPN 全称以太网虚拟专用网络,是 BGP 的一个地址族(evpn-family),专门用来同步两类信息:
- EVPN 2 类路由:终端 MAC + 所属 VNI(解决二层互通,替代静态 VXLAN 手动指定 VTEP);
- EVPN 5 类路由:VNI 对应的三层网关 IP(解决跨 VNI 三层互通,也就是你看不懂的分布式网关)。
一句话记:EVPN 是 VXLAN 的动态控制面,没有 EVPN 就是静态 VXLAN,无法大规模自动化。
3)BGP 基础极简要求
- BGP 邻居建立(IBGP,leaf 和 leaf/leaf-spine 建立邻居);
- 地址族概念(ipv4-family underlay、evpn-family overlay 分开);
- RT 导入导出、RD 路由区分;
- 路由传递、下一跳修改。
阶段 2:分层拆解 3 种架构,一次性分清二层 / 三层、集中 / 分布式网关(解决你最大的困惑)
模块 1:纯二层 BGP EVPN VXLAN(仅跨设备二层互通,无三层网关)
适用:同业务 VNI 跨 leaf 二层互通,跨 VNI 不通,无网关。
- 只交互 EVPN Type2 MAC 路由;
- 无三层网关,不能跨网段访问;
- 对应你说的「二层 VXLAN」。
模块 2:集中式网关 EVPN VXLAN(最早传统方案)
- 架构:所有 leaf 只做二层 VXLAN,单独一台 spine / 核心做三层网关;
- 跨 VNI 三层流量:所有跨网段流量全部上送到集中网关转发,再原路回包;
- 缺点:网关单点瓶颈,大机房流量拥堵;
- 路由行为:leaf 只发布 Type2 MAC 路由,集中网关下发 Type5 网关路由。
模块 3:分布式网关 EVPN VXLAN(现在数据中心主流,你最懵的点)
- 架构:每一台 Leaf 同时做二层 VTEP + 三层网关,每个 leaf 都有全业务 VNI 的三层 Vlanif 接口;
- 跨 VNI 流量:终端网关就在本地 leaf,流量不用上送核心,本地直接三层转发;
- 实现原理:每台 leaf 通过 EVPN Type5 路由,把本机 VNI 网关 IP 同步给所有对端 leaf;
- 优势:负载分担、无单点瓶颈,现在云 / 虚拟化机房全部用这个架构;
- 一句话区分集中 / 分布式:
- 集中:三层网关只有一台;
- 分布式:每台 leaf 都是三层网关。
最简区分口诀(背诵)
- 只二层互通、不能跨网段 → 二层 VXLAN;
- 跨网段流量全部走一台核心网关 → 集中式三层 VXLAN;
- 每台 leaf 本地转发跨网段流量、无单点网关 → 分布式三层 VXLAN;
阶段 3:模拟器实操(核心!只看文档永远不会,必须搭环境敲配置)
工具推荐:H3C Cloud Lab(HCL)免费,完美模拟 S5820V2/S9850 leaf-spine
实操循序渐进 3 套实验,一套比一套复杂,做完彻底打通逻辑
实验 1:2 台 Leaf 静态 VXLAN(纯二层,无 BGP EVPN)
目标:理解 VXLAN 封装、VTEP、泛洪机制
操作要点:手动指定对端 VTEP,同 VNI PC 互通,跨 VNI 不通。
实验 2:2 台 Leaf BGP EVPN 纯二层 VXLAN(无三层网关)
目标:理解 EVPN Type2 路由自动同步 MAC,不用手动配置 VTEP
- Underlay 用 OSPF 打通两台 loopback;
- 建立 BGP EVPN 邻居;
- 终端上线自动同步 MAC 到对端,拔插 PC 观察 EVPN 路由消失 / 生成。
实验 3:2Leaf+1Spine 分布式网关 BGP EVPN VXLAN(生产标准架构,重中之重)
覆盖你所有疑问点,生产机房 90% 都是这套架构:
- Underlay:Leaf 与 Spine 建立 OSPF,全互联三层可达;
- Overlay:Leaf 之间 IBGP EVPN 邻居;
- 每台 Leaf 配置所有业务 VNI 三层 Vlanif(分布式网关核心);
- 验证:
- 同 VNI PC 二层互通(EVPN Type2);
- 不同 VNI PC 跨网段互通(EVPN Type5 分布式网关);
- 必做对比:删除分布式网关配置,改成集中式网关,观察流量转发路径变化,直观看到两种架构差异。
实操强制要求
每敲完一段配置,执行这 4 条命令观察表项,对应理论:
display evpn mac-address vni X 查看 EVPN 同步的终端 MAC;
display bgp evpn all routing-table 查看 Type2/Type5 路由;
display vxlan tunnel 查看 VTEP 隧道;
display ip routing-table vpn-instance X 分布式网关三层路由表。
阶段 4:生产故障专项学习(学会排错,满足你解决现场问题的需求)
理论 + 实验后,专门梳理高频故障,对应机房真实问题,每类故障掌握定位流程:
1)Underlay 底层不通(隧道 Down,终端完全不通)
排查流程:ping 对端 loopback → 检查 OSPF 邻居 → 检查互联接口 IP;
现象:
display vxlan tunnel 隧道协议 Down。
2)BGP EVPN 邻居起不来
排查:BGP EVPN 地址族、邻居 loopback 可达、RT RD 匹配、更新源配置;
3)同 VNI 二层不通(EVPN Type2 MAC 路由缺失)
排查:检查 VNI 绑定 VSI、终端是否上线、EVPN 是否发布本地 MAC、RT 导入导出;
4)跨 VNI 三层不通(分布式网关核心故障)
- 分布式网关漏配 Vlanif 三层接口;
- EVPN Type5 路由没有同步到对端 leaf;
- 三层接口没绑定 VSI,网关路由无法发布;
5)虚拟机迁移后业务断流(EVPN MAC 路由老化 / 同步延迟)
6)广播泛洪风暴、VM 多活 MAC 漂移、MLAG 双活与 EVPN 联动故障(机房高频)
故障学习方法
- 模拟器人为制造故障:比如删除 BGP EVPN 邻居、关闭 Vlanif 三层口、断开 Underlay 链路;
- 模拟故障后,按上面流程一步步排查,复现现场排错思路;
- 收集网上真实项目故障案例,对照实验复现。
阶段 5:配套资料精准选择(避开杂乱文档,只看针对性内容)
1)官方文档(优先级最高)
H3C 官网 Comware V7《EVPN VXLAN 配置指导》,分 3 章节:
- 静态 VXLAN;
- BGP EVPN 二层 VXLAN;
- BGP EVPN 分布式网关 VXLAN;
文档是分模块写的,对应你 3 套实验,不要一口气全读,做一套实验看对应一节。
2)视频 / 文字教程(辅助理解)
- 先看「静态 VXLAN 基础」;
- 再看「EVPN 控制面原理」;
- 最后看「分布式网关架构详解」;
3)避坑提醒
不要一上来直接搜 “BGP EVPN VXLAN 全套配置”,通篇复制只会知其然不知其所以然,原理混淆,故障完全不会排。
完整学习时间规划(循序渐进,不混乱)
- 第 1~3 天:补 VXLAN 基础、OSPF/BGP 前置,做完静态 VXLAN 实验;
- 第 4~7 天:学习 EVPN 地址族,做完二层 EVPN VXLAN 实验;
- 第 8~14 天:搭建 Leaf-Spine 分布式网关完整架构,吃透二层 / 三层、集中 / 分布式区别;
- 第 15 天以后:人为制造故障练习排错,结合真实项目案例巩固。
最后给你一句核心心法,解决你 “看得懂原理,上手就懵” 的问题
- 文档是工具书,不是教材,先搭最小化环境实操,看不懂的地方再翻文档,不要纯看文字脑补;
- 所有概念全部对应设备表项:EVPN MAC 表、BGP EVPN 路由表、VXLAN 隧道表,看到表项才能真正理解;
- 区分架构只看一件事:跨 VNI 三层流量在哪台设备转发,一眼分清集中 / 分布式;
- 静态 VXLAN 是 “手动版 EVPN”,EVPN 只是自动化同步 MAC / 网关路由,底层 VXLAN 封装逻辑完全不变,抓住这个共性就不会混乱。