M-LAG (Multi-Chassis Link Aggregation Group), iki veya daha fazla fiziksel switch’in tek bir mantıksal switch gibi davranmasını sağlayan teknolojidir. Normal LAG/Port-Channel' da bir cihaz ile tek bir switch arasında çoklu port birleştirilir. Yük paylaşımı ve yedeklilik sağlanır, ama switch tarafı tek olmalıdır. M-LAG' da bu yapıyı iki ayrı switch üzerinde kurmaya izin verir. Böylece iki switch aynı anda aynı cihaza (örneğin router, server veya access switch) LAG üzerinden bağlanabilir. Karşı cihaz, sanki tek bir switch’e bağlıymış gibi çalışır.
Kullanım Alanları
Bir sunucuda 2 adet 10G port olduğunu varsayalım. Normalde bunları aynı switch’e bağlarsınız (LAG). Ama switch arızalanırsa sunucu bağlantısı düşer. M-LAG ile bu 2 portu farklı switch’lere bağlarsınız, ama sunucu hala bunu tek bir Port-Channel gibi görür. Böylece bir switch düşse bile bağlantı devam eder.
M-LAG ile Stack benzer amaca hizmet eder (yük paylaşımı, yedeklilik, tek mantıksal cihaz gibi davranma) ama mimarileri ve operasyonel yönleri farklıdır.
Yedeklilik – Switch’lerden biri arızalansa bile diğer switch üzerinden trafik devam eder.
Loop-free – STP (Spanning Tree Protocol) bağımlılığı ortadan kalkar veya en aza iner.
Yük Paylaşımı – Trafik, iki switch üzerindeki portlara dağıtılır.
Kesintisiz Hizmet – Uplink veya switch arızalarında ağ servisleri kesilmez.
Birden fazla switch fiziksel olarak özel kablo (stack kablosu / backplane) ile birbirine bağlanır ve tek bir mantıksal switch gibi davranır.
Avantajları Nedir?
Tam entegrasyon → Yönetim açısından tek bir cihazdır (tek IP, tek config).
Tek control-plane → Routing, STP, ARP, MAC tabloları tek yerde tutulur.
Basit yönetim → CLI’de tek switch gibi görünür.
Hızlı switching fabric → Stack kabloları yüksek bant genişliği sunar (örn. 480Gbps).
Basit kampüs ağında Stack daha kolay ve pratik. Büyük ölçekli, farklı rack/oda data center tasarımlarında ise M-LAG tercih edilir.
Fiziksel limit → Switch’lerin aynı model/seri olması ve stack kablosu ile birbirine yakın olması gerekir.
Tek noktada failure riski → Master switch arızalanırsa, failover süresi uzayabilir.
Büyük ölçeklerde esnek değil → Data center spine-leaf gibi farklı odalarda, uzak mesafelerde kurmak uygun değildir.
Versiyon uyumu → Tüm stack üyeleri aynı yazılım versiyonunda olmalı.
Yönetim: Kolay
Fizikse Kısıt: Aynı Seri, aynı rack
Control Plane: Ortak
Yedeklilik: Orta (Master arızası riskli)
Kullanım Alanı: Küçük/Orta ölçekli LAN
Failover Süresi: Genelde hızlı (ama master kritik)
Yönetim: İki Cihaz (Karmaşık)
Fizikse Kısıt: Farklı rack/oda/mesafe mümkün
Control Plane: Ayrı (senkronizasyon gerekli)
Yedeklilik: Yüksek
Kullanım Alanı: Data Center, Carrier, Spine-Leaf
Failover Süresi: Peer-link tasarımına bağlı
Yanda 2 adet Huawei CE 6000/8000 serisi switch' in M-LAG yapılandırmasının nasıl gerçekleştirileceğine dair görsel ve konfigürasyon çıktılarını sizinle paylaşıyorum.
Burada outputları inceleyebiliriz.Kim master kim backup, tabiki buna priority karar verir. M-Lag durumları vs...
Öneli husus, ip adresleri, priority değerleri, eth-trunklar karşılıklı düzgün girilmelidir. İnterface' ler altında description yazarsak daha rahat manage edebiliriz.
Her iki cihazda da stack yapılandırması tamamlandıktan sonra cihazlar reboot edilir. Tekrar açıldıklarında ise iki cihaz tek bir cihaz gibi açılıp (tek control plane olarak) yapının yönetimi priority değeri 150 olan cihazdan sağlanır.
"display stack configuration" komutu ile stack portlar görüntülenebilir.
Ayrıca yine "display stack" komutu ile stack yapının aktiflik ve pasiflik durumu check edilebilir.
Stack ile İlgili Detaylar..
Master-Slave Seçimi: Stack’te bir switch master olur, diğerleri slave. Master’ın yazılımı veya CPU’su sorunlu ise tüm stack etkilenebilir.
Upgrade: Stack cihazlarının yazılım güncellemesi genelde ISSU (In-Service Software Upgrade)desteklemiyorsa komple kesinti gerektirir.
Loop Riski: Stack kendi içinde loop yapmaz ama yanlış port-channel konfigürasyonu yapılırsa yine sorun yaşanabilir.
Performans: Stack kablosu yüksek bant genişlikli backplane sunar, ama port sayısı arttıkça CPU yükü master’da toplanır.
M-LAG ile İlgili Detaylar...
Peer-Link Kritikliği: Peer-link taşma (overflow) yapmamalı. Genellikle 2×40G veya 2×100G uplink tercih edilir.
Heartbeat Link: Peer-link koparsa “split-brain” olur. Bunu önlemek için ayrı bir keepalive/heartbeat link tasarlanmalıdır. Huawei’de bu genelde ayrı bir management interface üzerinden yapılır.
Control Plane Ayrılığı: CE1 ve CE2 routing tablolarını ayrı tutar. Örneğin, OSPF/ISIS komşulukları her iki switch üzerinde ayrı ayrı kurulur. Stack’ten farkı budur.
ISSU Avantajı: M-LAG yapısında bir switch upgrade edilip reboot edilse bile diğer switch trafiği taşımaya devam eder → kesintisiz upgrade imkanı sağlar.
Yedeklilik Seviyesi: Stack’te “master” bir SPOF (Single Point of Failure) iken, M-LAG’de her switch bağımsız çalışır.
Arıza Senaryoları
Stack Arızası:
Master switch arızalanırsa slave devralır ama failover birkaç saniye sürebilir. Stack kablosu koparsa, genelde stack parçalanır ve sorun çıkar.
M-LAG Arızası:
Bir switch tamamen down olsa bile diğeri çalışmaya devam eder. Peer-link down olursa, split-brain senaryosu olur → biri “standalone mode”’a düşer (bu vendor’a göre değişir). Access switch tarafında port-channel LACP protokollü yapılırsa, yanlışlıkla loop oluşma riski azalır.
Tasarımda Dikkat Edilmesi Gerekenler
Stack için:
Stack kablosu mutlaka çift yönlü (ring) olmalı. Tek kablo ile stack yapılmaz. Stack üyeleri aynı yazılım versiyonunda tutulmalı.
M-LAG için:
Peer-link kapasitesi yükün en az %50’sini kaldırabilecek şekilde planlanmalı. Heartbeat mutlaka ayrı network üzerinden sağlanmalı. Aynı M-LAG domain içinde farklı vendor cihazlar genellikle desteklenmez.
· Stack = Yönetimi kolay, küçük/orta ölçek kampüs ve erişim switch’leri için uygun.
· M-LAG = Daha esnek, yüksek yedeklilikli, Data Center & Carrier ağları için uygun.
· Sahada kritik fark → M-LAG ile cihazları kesintisiz upgrade etmek mümkün, Stack’te bu çoğunlukla mümkün değil.
Özellikle Stack ve M-LAG’in sahadaki kullanımında karşılaşılan operasyonel farklılıklar, tasarım dikkatleri ve arıza senaryoları önemli oluyor.
· Durum: Stack’te master CPU çöker veya cihaz kapanır.
· Sonuç: Slave switch, yeni master olarak seçim yapar.
· Etkisi:
o Failover süresi 2–5 saniye olabilir.
o Routing protokolleri (OSPF, BGP, ISIS) yeniden komşuluk kurabilir → kısa süreli trafik kesintisi.
o STP’de yeniden root seçimi olabilir.
👉 Stack, master’a bağımlı olduğu için CPU’su yoğun çalışan master’da risk yüksektir.
· Durum: CE1 ↔ CE2 stack link’i kopar.
· Sonuç: Split-stack olur → her switch kendini master sanabilir.
· Etkisi:
o Broadcast storm / MAC table inconsistency riski.
o Ağda loop oluşabilir.
o Trafik kayıpları ciddi olabilir.
👉 Bu yüzden stack kabloları mutlaka ring şeklinde (CE1 ↔ CE2, CE2 ↔ CE3, CE3 ↔ CE1) bağlanmalı.
📍 Senaryo A – Bir switch tamamen kapanır
· Durum: CE1 kapanır, CE2 çalışmaya devam eder.
· Sonuç: Access switch tarafındaki LAG CE2 üzerinden aktif kalır.
· Etkisi:
o Trafik kesilmez.
o Routing protokolleri CE2 üzerinden devam eder.
o Sunucu veya access switch hiçbir şey fark etmez.
👉 Bu M-LAG’in en güçlü avantajıdır.
📍 Senaryo B – Peer-link kopar
· Durum: CE1 ↔ CE2 peer-link down olur.
· Sonuç:
o Her iki switch de çalışmaya devam eder ama senkronizasyon kaybolur.
o Eğer heartbeat link varsa → biri “standalone mode”’a düşer, loop engellenir.
o Heartbeat yoksa → split-brain oluşur (her iki switch kendi başına çalışır, MAC/ARP tabloları farklılaşır).
· Etkisi:
o Trafik asimetrik yönlenebilir.
o Bazı akışlar düşebilir.
o Uygun tasarlanmazsa ciddi servis kesintisi olabilir.
👉 Bu yüzden peer-link her zaman yüksek bant genişlikli ve yedekli olmalı, ayrıca heartbeat link konfigüre edilmeli.
📍 Senaryo C – CE1 upgrade edilir
· Durum: CE1 ISSU desteklemese bile reboot edilerek upgrade yapılır.
· Sonuç: CE2 tüm trafiği taşır. CE1 tekrar açıldığında M-LAG senkron olur.
· Etkisi: Hiçbir trafik kesintisi yaşanmaz.
👉 Bu, Stack’e göre en büyük operasyonel avantajdır.
Peer-Link Kopma Durumunda Log Mesajları
Huawei CE switch üzerinde peer-link down olduğunda şu tarz loglar düşer:
%%01M-LAG/4/PEERLINK_DOWN(l)[1]:The peer-link is Down. (domain=1, interface=10GE1/0/48)
%%01M-LAG/4/PEER_STATE_CHANGED(l)[2]:The peer state has changed. (domain=1, peer-ip=192.168.1.2, old=Up, new=Down)
%%01M-LAG/3/SPLIT_BRAIN_RISK(l)[3]:Split-brain risk detected. (domain=1, peer-ip=192.168.1.2)
· PEERLINK_DOWN → Peer-link interface fiziksel veya L2 seviyesinde down oldu.
· PEER_STATE_CHANGED → M-LAG peer ile iletişim koptu.
· SPLIT_BRAIN_RISK → Heartbeat link devrede değilse split-brain riski oluştuğu bildiriliyor.
Eğer heartbeat link düzgün konfigüre edilmişse, log şuna benzer olur:
%%01M-LAG/5/STANDALONE_MODE(l)[4]:Device has entered standalone mode. (domain=1)
👉 Bu durumda switch’lerden biri (priority düşük olan) otomatik olarak standalone mode’a düşer, loop engellenir.
Web sitesi trafiğini analiz etmek ve web sitesi deneyiminizi optimize etmek amacıyla çerezler kullanıyoruz. Çerez kullanımımızı kabul ettiğinizde, verileriniz tüm diğer kullanıcı verileriyle birlikte derlenir.