MetalLB 在 Kubernetes Bare Metal 上安裝 Layer 2 Load Balancer
準備
假設你已經先裝好 Kubernetes cluster 了,由於是 bare metal,你必須把 Kubernetes 裝載三台不同電腦上,或是使用三個 Raspberry Pi,然後使用 kubeadm
指令串起來。
Cluster Addresses
我們現在有三台電腦,它的名稱與 IP 分別是:
Master:192.168.1.100
Node1:192.168.1.101
Node2:192.168.1.102
當你在安裝電腦時,名稱與 IP 必須是唯一的,否則在 join 的時候會出現錯誤。
這裡使用的 IP 是 DHCP 所分配的 IP,IP 的範圍是 192.168.1.100—192.168.1.150
,如果你有足夠的 public IP address,可以分別對每台電腦做設定。
假設我申請了
17.95.16.0-17.95.16.32
,就可以把 IP 設定成這樣:
- Master:17.95.16.1
- Node1:17.95.16.2
- Node2:17.95.16.3
雖然只用了三個,但我們保留剩下的
17.95.16.10-17.95.16.32
讓 Load Balancer 來分配這些網址
Metallb
安裝 metallb 的步驟非常的簡單:
1 | kubectl apply -f https://raw.githubusercontent.com/google/metallb/v0.7.3/manifests/metallb.yaml |
然後查看目前的狀態,是否有一個 controller 跟多個 speaker:
1 | kubectl get pods -n metallb-system |
因為我們還沒有提供 load balance 的網址給他,所以接下來要設定 ConfigMap
Configure
架設我們想提供 load balance 的網址是 192.168.1.240-192.168.1.250
,看一下我們的設定檔:
1 | apiVersion: v1 |
我們把 protocol: layer2
套用在 192.168.1.240-192.168.1.250
這個網段上
如果想要使用外網的話,直接把網段的範圍改成外網即可
MetalLB 提供了 layer2 跟 bgp 兩種 protocol,這裡使用 layer2,如果使用 bgp 的話還需要另外做設定,可以參考官方文件。
套用上面的 ConfigMap:
1 | kubectl apply -f https://raw.githubusercontent.com/google/metallb/v0.7.3/manifests/example-layer2-config.yaml |
查看 Log:
1 | kubectl logs -l component=speaker -n metallb-system |
測試
執行一些簡單的容器,然後使用 LoadBalancer 暴露它:
1 | kubectl run hello-world --image=k8s.gcr.io/echoserver:1.10 --port=8080 --replicas=3 |
查看 pods 是否有在運行
1 | kubectl get pods |
我們現在有外部 IP 了!馬上測試看看能不能連得到:
1 | curl 192.168.1.240:8080 |
如果有看到跟請求 http 有關的資訊的話,就代表你成功了。
Reference
Bare Metal 在 Ubuntu 上安裝 Kubernetes
Docker
在安裝 Kubernetes 前要先安裝好 Docker,可以參考這篇:
在 Ubuntu 18.04 上安裝 Docker CEKubeadm
kubeadm 負責管理節點,可以透過方便的指令將電腦加入 cluster,在這裡我們先定義:
- Master:代表主結點,負責控制與分發任務
- Node:代表子結點,負責執行 Master 所分發的任務
[Master, Node] 安裝 Kubeadm 需要 root 權限:
1 | sudo su - |
[Master, Node] 安裝 kubeadm:
1 | curl -s https://packages.cloud.google.com/apt/doc/apt-key.gpg | apt-key add - |
apt 安裝 kubeadm 完後會連同 kubelet 跟 kubectl 一起安裝。
[Master] 在 Master 節點上初始化 Kubernetes:
1 | kubeadm init --pod-network-cidr 10.244.0.0/16 |
因為我們是使用 flannel,所以必須加上 --pod-network-cidr
。
我們這邊選擇 flannel 的是因為 flannel 支援 arm。
如果要透過 WIFI 連接網路的話,需要加上 --apiserver-advertise-address=<wifi-ip-address>
參數到 kubeadm init
指令上。
執行 kubeadm init
之後會有一行 kubeadm join
,如果弄丟的話,可以執行下面指令獲得:
1 | kubeadm token create --print-join-command |
[Node] 然後把其他的 node 加進來:
1 | kubeadm join 192.168.0.11:6443 --token 3c564d.6q2we53btzqmf1ew \ |
[Master, Node] 離開 root:
1 | exit |
Kubectl
[Master] 回到使用者模式後執行:
1 | mkdir -p $HOME/.kube |
將 admin.conf
放置到 ~/.kube/config
就會自動抓取設定檔。
[Master] 安裝 flannel,相關文件在 CoreOS 上:
1 | kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/bc79dd1505b0c8681ece4de4c0d86c5cd2643275/Documentation/kube-flannel.yml |
[Master] 查看目前節點:
1 | kubectl get nodes |
測試
執行一些簡單的容器:
1 | kubectl run kuard --image=gcr.io/kuar-demo/kuard-amd64:blue --replicas=3 |
查看 pods 是否有在運行
1 | kubectl get pods |
使用 LoadBalancer 暴露它:
1 | kubectl expose deployment kuard --type=LoadBalancer --port=80 --target-port=8080 |
查看 Service
1 | kubectl describe service/kuard |
使用 curl 連到 pod 的 endpoint:
1 | curl 10.244.1.5:8080 |
Trouble Shooting
Swap Error
當你用 root 權限執行 kubeadm init
時,會出現 ERROR Swap 的錯誤:
1 | kubeadm init --pod-network-cidr 10.244.0.0/16 |
如果啟用 swap 的話,當你記憶體不夠用的時候,OS 會先把暫時沒有用的資料存到硬碟裡,又稱作為 swap out。相反,OS 需要用到剛剛存在硬碟裡的資料,則會把資料再載入回記憶體裡面,又稱作為 swap in。
使用 Kubenetes 的時候需要停用 swap 這個功能:
1 | swapoff -a |
相關討論在 Github 的 issue 上。
上面的設定在重新開機之後就會失效 swap,要將 swap 完全關掉的話,需編輯 /etc/fstab 這個檔案,將 mount point 在 / 的項目註解掉:
1 | /etc/fstab |
exec format error
由於 CPU 有分 Intel 跟 Arm 的架構,這個問題會發生是因為 Docker image files 是基於某個特定的架構。也就是說,在 Intel 上建立的 Docker file 只能在 Intel 上執行;在 Arm32 上建立的 Docker file 只能在 Arm32 上執行。
所以當你使用 kubectl logs
查看某個 pod 出現如下的錯誤時:
1 | kubectl logs pod/kuard-777c5775cd-lg7kc |
確認你的 Docker image 有支援你 CPU 的架構
Stackoverflow 上的討論
Reference
- Kubernetes Officall Documentation: Setup Docker
- Kubernetes Officall Documentation: Installing kubeadm kubelet kubectl
- CoreOS Flannel
- Error Swap: running with swap on is not supported. Please disable swap
- Error exec user process caused exec format error
- How to safely turn off swap permanently and reclaim the space?
在 Kubernetes Minikube 上安裝 Load Balancer MetalLB
MetalLB
MetalLB 是 Bare metal Kubernetes 的 load balancer,如果原先你使用 --type=LoadBalancer
來暴露你的 port 的話,service 裡的 EXTERNAL-IP
會一直是 pending 的狀態:
1 | kubectl expose deployment hello-world --type=LoadBalancer |
要解決這個方法其實有很多種,你可以使用現有的雲端平台,像是 GCP、AWS 等等,這些雲端平台上都有提供 Load Balancer 的服務,當然你需要付些費用,如果要免費的話,可以自己安裝 OpenStack。
但是我們只需要 Kubernetes 的功能,卻要把整個 OpenStack 安裝好,然後只用其中的 Load Balancer 的話,這個作法實在有點殺雞焉用牛刀。
如同 GitHub 上這篇 issue 所說的,為何不單把 Load Balancer 的服務抽出來安裝就好呢,於是 MetalLB 就這樣誕生了
Installation
首先你必須先安裝好 minikube,minikube 的安裝就自行 google 了,而且還需要對 Kubernetes 的指令有一些基礎。
BGP Router UI
查看 BGP router 狀態,你可以使用網頁查看 BGP router 目前的狀態
1 | kubectl apply -f https://raw.githubusercontent.com/google/metallb/v0.7.3/manifests/test-bgp-router.yaml |
使用 minikube 開啟網頁:
1 | minikube service -n metallb-system test-bgp-router-ui |
MetalLB
安裝最重要的 Metallb,他會在 metallb-system
namespace 底下產生 daemonset speaker
跟 deployment controller
。
1 | kubectl apply -f https://raw.githubusercontent.com/google/metallb/v0.7.3/manifests/metallb.yaml |
這時候重新刷新 BGP Router UI 的話,裡面的內容會跟安裝前的不一樣。
ConfigMap
MetalLB 的設定檔是透過 Kubernetes 裡面的 config map 下去做設定的,你必須跟他講他能夠分配的 IP 池,跟一些相關設定。
1 | apiVersion: v1 |
看到後面倒數幾行
- avoid-buggy-ips: true:代表 Load Balancer 在分配 IP 的時候,會從
.1
開始分配,而不會從.0
開始 - 198.51.100.0/24:Load Balancer 能分配的 IP 池
然後我們就套用這些設定吧:
1 | kubectl apply -f https://raw.githubusercontent.com/google/metallb/v0.7.3/manifests/tutorial-3.yaml |
檢查
來跑一些簡單的容器,然後使用 LoadBalancer 暴露它:
1 | kubectl run hello-world --image=k8s.gcr.io/echoserver:1.10 --port=8080 |
使用 kubectl get service
指令查看現在 service 的狀態,可能需要等個幾秒鐘,EXTERNAL-IP
這個欄位就會是 MetalLB 從 IP 池分配給我們的 IP:
1 | kubectl get service |
沒有看到 pending 的話,就代表你成功了。
Reference
在 Ubuntu 上架設 NFS server
思路
NFS (Network File System) 可以透過網路,讓不同的作業系統,分享個別的檔案。
而我想要在 Ubuntu 上建立 NFS Server,透過 Mac 上的 NFS Client 連上。目前的環境:
- Ubuntu 18.04: 192.168.0.10
- Mac OS X Mojave: 192.168.0.20
NFS Server
安裝
1 | ubuntu bare metal |
安裝好之後,會在 /etc
底下會多一個 exports
的檔案,待會我們可以修改這個檔案,來調整想要分享的檔案。
至於 docker 的部分是來自於這個 repo
建立資料夾
我想要把 /tmp/nfs
這個資料夾分享出去,所以先建立這個資料夾:
1 | mkdir -p /tmp/nfs |
資料夾權限
目前 /tmp/nfs
的權限是 root:root
,第一個 root 是 owner 的權限,第二個 root 是 group 的權限:
1 | ls -la /tmp/nfs |
要把檔案分享出去的話,需要修改資料夾的權限為 nobody:nogroup
,且加上 -R
的參數把資料夾底下的所有子資料夾都設為 nobody:nogroup
:
1 | sudo chown -R nobody:nogroup /tmp/nfs |
如果後來又新增檔案的話,必須再重新執行一次這一行指令。
否則在之後 mount 的時後會出現 Operation not permitted
的錯誤:
1 | mount_nfs: can't mount /tmp/nfs from 192.168.0.10 onto ...: Operation not permitted |
設定
修改 /etc/exports
:
1 | sudo vim /etc/exports |
然後把想要分享的檔案加入:
1 | /etc/exports |
至於選項是選擇性填寫的,有很多參數可以選:
ro
:read onlyrw
:read and writeasync
:此選項允許 NFS Server 違反 NFS protocol,允許檔案尚未存回磁碟之前回覆請求。這個選項可以提高性能,但是有可能會讓 server 崩潰,可能會需要重新啟動 server. 或檔案遺失。sync
:只會儲存檔案會磁碟之後才會回覆請求。no_subtree_check
:禁用子樹檢查,會有些微的不安全,但在某些情況下可以提高可靠性。secure
:請求的 port 必須小於 1024,這個選項是預設的。insecure
:請求的 port 不一定要小於 1024。
User ID Mapping 參數:
root_squash
:將 uid 0 的使用者映射到 nobody 匿名使用者,這個選項是預設的。no_root_squash
:關掉 root squash 的選項,這個選項可以使用 root 身份來控制 NFS Server 的檔案。all_squash
:所有登入 NFS 的使用者身份都會被壓縮成為 nobody。anonuid and anongid
:調整匿名使用者的權限,可以讓所有透過 NFS 修改文件,都看起來是同一個使用者。
更多參數的選項可以參考 LInux exports
重新啟動 Server
1 | sudo systemctl restart nfs-kernel-server |
檢查
輸入以下的指令,確認使否把檔案加入 NFS Server:
1 | sudo exportfs |
目前 showmount 的指令會是空的,因為還沒有 NFS Client 連上,如果連上的話,NFS Server 這邊可以使用 showmount 指令查看哪個 Client IP 連過來的:
1 | showmount |
NFS Client
安裝
這台 Ubuntu 的 IP 是 192.168.0.30
1 | ubuntu |
Mount
我想要跟 share 資料夾做分享,使用 mount 指令將遠端的資料夾 /tmp/nfs
掛載到本地端的資料夾 share
:
1 | mac |
注意在 mac 上必須加上 -o resvport
的參數,否則會出現 Operation not permitted
的錯誤。
檢查
輸入以下指令檢查是否掛載成功:
1 | mac, ubuntu |
測試
在 /tmp/nfs
資料夾內建立 test
檔案:
1 | mac, ubuntu |
是否能成功建立
Unmount
1 | mac, ubuntu |
Mac 將 iso 轉 usb、dmg 轉 usb、iso 轉 dmg
ISO to USB
列出外部磁碟
1 | diskutil list external |
1 | diskutil list external |