如何理解SaaS多租戶的設計?

多租戶技術簡稱SaaS,是一種軟體架構技術,是實現如何在多使用者環境下共用相同的系統或程式元件,並且可確保各使用者間資料的隔離性。本文對SaaS的多租戶設計進行了分析闡述,一起來看一下吧。

如何理解SaaS多租戶的設計?

多租戶定義:多租戶技術或稱多重租賃技術,簡稱SaaS,是一種軟體架構技術,是實現如何在多使用者環境下(此處的多使用者一般是面向企業使用者)共用相同的系統或程式元件,並且可確保各使用者間資料的隔離性。

簡單講:在一臺伺服器上執行單個應用例項,它為多個租戶(客戶)提供服務。

從定義中我們可以理解:

多租戶是一種架構,目的是為了讓多使用者環境下使用同一套程式,且保證使用者間資料隔離。

那麼重點就很淺顯易懂了,多租戶的重點就是同一套程式下實現多使用者資料的隔離。對於實現方式,我們下面會討論到。

在瞭解詳細一點:

在一個多租戶的結構下,應用都是執行在同樣的或者是一組伺服器下,這種結構被稱為“單例項”架構(Single Instance),單例項多租戶

多個租戶的資料是儲存在相同位置,依靠對資料庫分割槽來實現隔離操作。既然使用者都在執行相同的應用例項,服務執行在服務供應商的伺服器上,使用者無法去進行定製化的操作,所以這對於對該產品有特殊需要定製化的客戶就無法適用,所以多租戶適合通用類需求的客戶。那麼缺點來了,多租戶下無法實現使用者的定製化操作。

在翻閱多租戶的資料時,還有一個名詞與之相對應,那就是單租戶SaaS架構(也被稱作多例項架構(Multiple Instance))。

單租戶架構與多租戶的區別在於

單租戶是為每個客戶單獨建立各自的軟體應用和支撐環境。單租戶SaaS被廣泛引用在客戶需要支援定製化的應用場合

,而這種定製或者是因為地域,抑或是他們需要更高的安全控制。

透過單租戶的模式,每個客戶都有一份分別放在獨立的伺服器上的資料庫和作業系統,或者使用強的安全措施進行隔離的虛擬網路環境中。因為本篇主要是討論多租戶,所以單租戶的相關知識就簡單瞭解一下,不做過多的闡述了。

一、多租戶資料隔離的三種方案

在當下雲計算時代,多租戶技術在共用的資料中心以單一系統架構與服務提供多數客戶端相同甚至可定製化的服務,並且仍可以保障客戶的資料隔離。目前各種各樣的雲計算服務就是這類技術範疇,例如阿里雲資料庫服務(RDS)、阿里雲伺服器等等。

多租戶在資料儲存上存在三種主要的方案

,分別是:

1. 獨立資料庫

這是第一種方案,即一個租戶一個數據庫,

這種方案的使用者資料隔離級別最高,安全性最好,但成本較高

優點:為不同的租戶提供獨立的資料庫,有助於簡化資料模型的擴充套件設計,滿足不同租戶的獨特需求;如果出現故障,恢復資料比較簡單。

缺點: 增多了資料庫的安裝數量,隨之帶來維護成本和購置成本的增加。

這種方案與傳統的一個客戶、一套資料、一套部署類似,差別只在於軟體統一部署在運營商那裡。如果面對的是銀行、醫院等需要非常高資料隔離級別的租戶,可以選擇這種模式,提高租用的定價。如果定價較低,產品走低價路線,這種方案一般對運營商來說是無法承受的。

2. 共享資料庫,獨立 Schema

這是第二種方案,即多個或所有租戶共享Database,但是每個租戶一個Schema(也可叫做一個user)。底層庫比如是:DB2、ORACLE等,一個數據庫下可以有多個SCHEMA。

優點: 為安全性要求較高的租戶提供了一定程度的邏輯資料隔離,並不是完全隔離;每個資料庫可支援更多的租戶數量。

缺點: 如果出現故障,資料恢復比較困難,因為恢復資料庫將牽涉到其他租戶的資料; 如果需要跨租戶統計資料,存在一定困難。

3. 共享資料庫,共享 Schema,共享資料表

這是第三種方案,

即租戶共享同一個Database、同一個Schema,但在表中增加TenantID多租戶的資料欄位。這是共享程度最高、隔離級別最低的模式

即每插入一條資料時都需要有一個客戶的標識。這樣才能在同一張表中區分出不同客戶的資料。

優點:三種方案比較,

第三種方案的維護和購置成本最低,允許每個資料庫支援的租戶數量最多

缺點: 隔離級別最低,安全性最低,需要在設計開發時加大對安全的開發量; 資料備份和恢復最困難,需要逐表逐條備份和還原。

如果希望以最少的伺服器為最多的租戶提供服務,並且租戶接受犧牲隔離級別換取降低成本,這種方案最適合

在SaaS實施過程中,有一個顯著的考量點,就是如何對應用資料進行設計,以支援多租戶,而這種設計的思路,是要在資料的共享、安全隔離和效能間取得平衡。

二、選擇合理的實現模式

衡量三種模式主要考慮的因素是隔離還是共享。

1)成本角度因素

隔離性越好,設計和實現的難度和成本越高,初始成本越高。共享性越好,同一運營成本下支援的使用者越多,運營成本越低。

2)安全因素

要考慮業務和客戶的安全方面的要求。安全性要求越高,越要傾向於隔離。

3)從租戶數量上考慮

主要考慮下面一些因素:

系統要支援多少租戶?上百?上千還是上萬?可能的租戶越多,越傾向於共享。

平均每個租戶要儲存資料需要的空間大小。存貯的資料越多,越傾向於隔離。

每個租戶的同時訪問系統的終端使用者數量。需要支援的越多,越傾向於隔離。

是否想針對每一租戶提供附加的服務,例如資料的備份和恢復等。這方面的需求越多, 越傾向於隔離。

4)技術儲備

共享性越高,對技術的要求越高。

三、團隊開發框架實戰—多租戶支援

多租戶技術的實現重點,在於不同租戶間應用程式環境的隔離(application context isolation)以及資料的隔離(data isolation),以維持不同租戶間應用程式不會相互干擾,同時資料的保密性也夠強。

多租戶資料庫構架方式主要分為:

獨立資料庫(私有表)、共享資料庫隔離資料框架(擴充套件表)、共享資料庫共享資料框架(通用表)

以上架構模式中,資料隔離程度相對較差,資料共享程度越高,越能夠支援較多的租戶,同時裝置成本越低,但同時資料維護難度越大。如敏感資料較多,則選擇共享資料庫隔離資料框架,否則可選擇共享資料庫共享資料框架的方式進行資料儲存構架。

本專案系統可能出現數量較多的租戶,同時裝置有限,所以選取

共享資料庫共享資料框架(通用表)的資料儲存結構

資料表結構採用名稱值對的方式進行設計:將擴充套件資料的儲存和原資料表分離,另外用一個統一的擴充套件資料表來儲存。擴充套件資料表將資料表的橫向擴充套件列轉換為縱向的資料集,將每一條原始資料記錄的一個擴充套件欄位,都儲存成一條擴充套件資料行。將資料表中的資料記錄與配置元資料表中的配置記錄關聯,構成擴充套件資料記錄。可以提供無限數量的自定義擴充套件欄位。但是其增加資料操作的複雜性,查詢時也要多次訪問資料庫才能得到完整的業務資料。

多通用表與鍵值對的資料儲存架構儲存工作過程,上層應用透過標準多租戶資料定義、

儲存API 進行互動,透過標準的API 介面將多租戶資料儲存到資料空中;也可以透過查詢的方式來從統一儲存的資料庫中還原租戶的資料。

在圖中,多租戶資料管理系統主要進行的資料操作是開發檢視下進行的,主要操作有對租戶資料模型的定義和擴充套件、租戶資料的持久化儲存和查詢讀取。

在對租戶資料模型的定義和擴充套件過程中,需要將租戶的資訊提取出來單獨儲存;對租戶所定義的資料表包含的資料表名稱、資料表中列名稱、列值的型別、列值的資料長度、資料表與其他表中的關係等元資料提取出來進行管理。租戶資料的持久化儲存和查詢讀取操作,先對租戶的身份進行驗證,防止租戶對其他租戶資料進行操作。

透過物理SQL 語句生成模組將租戶資料查詢操作的邏輯SQL 與轉化成能夠直接在邏輯儲存層執行的SQL 語句。

租戶資料模型定義部件描述了租戶的定製資訊。這種定製資訊描述了租戶定製的資料表的名稱、資料型別、約束關係等。

邏輯SQL,是由租戶發起的資料查詢查詢請求。在資料管理分層模型中,開發檢視下,遮蔽了租戶無關的資料特性。租戶可以透過相關的介面進行資料查詢,因此邏輯SQL 與標準SQL 沒有區別。

物理SQL是用於實際查詢資料的SQL語句,它工作在邏輯儲存檢視層。物理SQL 是將邏輯SQL 語句邏輯資料表結構轉換成底層資料的物理資料表結構所形成的能夠在底層資料庫中執行的SQL 語句。

查詢重寫器的功能是將邏輯SQL 語句進行重新構造將其轉換為能夠在通用表上執行的物理SQL 語句。查詢重寫器獲取租戶發出的查詢請求,從資料庫中獲取租戶資訊,根據租戶查詢的資料表對應的元資料資訊,將租戶的查詢請求,轉換成為邏輯儲存層面上,資料庫系統能夠執行的查詢語句。

租戶管理模組的功能是將租戶的資訊、租戶所擁有的資料表資訊進行儲存和查詢,提供給資料管理系統中其他模組獲取租戶資料的能力。

租戶身份驗證主要是針對某一租戶的資料進行正確的儲存,正確地對映到資料庫系統中;當租戶對資料進行查詢時,能夠根據租戶資訊正確地查詢到租戶所需的資料,並在查詢過程中不對其他租戶資料產生影響。

當租戶進行資料模式定製時,租戶資料模式定製器獲取租戶所需定製的資料模式,並定製請求中分析出租戶對資料模型定製資訊,並將這些資訊寫入到元資料表中元資料表和,完成租戶資料模式的定製。

當租戶中使用者發起資料查詢請求時,查詢重寫部件查詢使用者資料庫,獲取該使用者所對應的租戶身份標識,根據查詢請求中的資料表模式資訊,從元資料表中查詢出相應的元資料資訊,將租戶中使用者發起的資料查詢請求進行重寫。

重寫過程如下,根據邏輯SQL 語句,從中提取出查詢關鍵字,需要查詢的邏輯資料表、資料列等資訊,根據這些資訊從元資料表中查找出相應的邏輯儲存表資訊,將實際儲存的資訊替換邏輯SQL 語句中的資訊,完成重寫。

通用表儲存模式下,當租戶發起業務資料模式新建時,邏輯資料管理提出租戶資訊,其中包含了租戶新建的資料表的列數及各列的描述,根據新建的命令,生成邏輯SQL 語句,提交到SQL 重寫器,SQL 重寫從邏輯SQL 語句中抽取出元資料,資料表元資料,欄位表元資料,關係表元資料,並根據SQL 重寫演算法,逐一生成物理SQL 語句,交予資料庫執行,序列圖如下所示。

當租戶查詢資料時,SQL 查詢重寫器捕捉到租戶查詢的邏輯SQL 語句,訪問控制管理從邏輯SQL 語句中感知租戶身份,並根據租戶的許可權,驗證資料查詢是否超出租戶許可權,若超出則返回,並給出超出許可權提示。

透過驗證則將邏輯查詢請求傳送給SQL 重寫器,重寫器從邏輯SQL 語句中抽取出查詢欄位,租戶虛擬表,查詢條件。根據租戶虛擬表從元資料中查詢出對應的元資料,查詢重寫器根據元資料,將邏輯SQL 語句轉化為物理SQL 語句,並在資料庫中查詢執行。

本文由@劉同學 原創釋出於人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基於CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供資訊儲存空間服務。