在程式設計中,分散式版本控制(英語:distributed revision control 或 distributed version control,又譯為分散式版本控制),又稱去中心化版本控制(decentralized version control),是一種版本控制的方式,它允許軟件開發者可以共同參與一個軟件開發專案,但是不必在相同的網絡系統下工作。其作法是在每個開發者電腦中複製一份完整的代碼庫以及完整歷史[1]。因此在無法連接網絡時,仍可以進行軟件的分支及合併,可以加速大部份的作業,增加此情形可以進行的工作,而且系統的代碼庫可以在多家電腦上備份,不需靠單一位置的備份[1][2][3][4]。而多個位置的代碼庫再透過其他機制來達到同步。
以分散式版本控制方法,作出的軟件版本控制系統,稱為分散式版本控制系統(distributed revision control system,縮寫為DRCS,或是distributed version control system,縮寫為DVCS)。著名的分散式版本控制系統有Monotone、Git等。
分散式和集中式版本控制系統的比較
分散式版本控制系統(DVCS)用對等網絡的作法來處理版本控制,而集中式版本控制系統則是用主從式架構的作法。分散式版本控制系統同步各軟件儲存庫的方式是用對等網絡的方式傳送Patch。在代碼庫中沒有單一的中央版本,每一個用戶都有工作複本以及完整的變更歷史。
和集中式版本控制系統相比,分散式版本控制系統的優點如下:
- 用戶在沒有網絡的情形下,也可以存取其電腦中的軟件儲存庫。
- DVCS下的常見工作(例如上載、看修改履歷、回退變更)不需要和中央伺服器通訊即可達成,因此速度很快[5]。DVCS下,只有要和其他人分享變更內容時才需要通訊。
- 允許個人作業,用戶可以將不希望公開的早期修改(甚至是草稿)上載[來源請求]
- 工作複本的作用類似遠端備份,因此不會依賴單一的實體機器,帶來單點失效的風險[5]
- 允許不同的開發模型,例如用分支或Commander/Lieutenant模型[來源請求]。
- 在自由及開放原始碼軟件專案中,若有管理上的衝突或是設計上的不一定,很容易可以從一專案中分叉出新的專案。
和集中式版本控制系統相比,分散式版本控制系統的缺點如下:
- 一開始複製軟件儲存庫會比較慢,因為預設設值會複製所有的分支以及版本歷史。
- 缺乏了集中式版本控制系統中有的鎖定機能,針對一些無法用版本控制系統合併的二進位檔案(例如圖形檔),或是太複雜的二進位或XML檔案(例如office檔案、PowerBI檔、SQL Server Data Tools BI軟件等)[來源請求]
- 每一個用戶都需要備份所有的資料、分支及版本歷史,因此需要額外的儲存空間[6]
- 各軟件儲存庫內容不一定同步。
有些版本控制系統原來是集中式的,但也會加入一些分散式的特點。例如Subversion的許多機能可以在沒有網絡時執行[7]。Visual Studio Online和Visual Studio Team Services除了集中式的版本管理外,也支援用Git進行的分散式版本控制。
也有些分散式版本控制系統設法要改善取出(checkout)時間以及儲存成本的問題,例如微軟開發的Git虛擬檔案系統就可以在很大的代碼庫下運作[8],會提供一個虛擬檔案系統,只在有需要時才會下載檔案到電腦中。
工作模式
分散式版本控制比較適合大型專案,有一部份由獨立的工作者所開發,像是Linux核心計劃,因為開發者可以獨立工作,可以提交其合併修改(或是拒絕他人的合併修改)。分散式模型的靈活性可以配合客製化的程式碼產生工作流程。最常使用的是整合式工作流。在集中型的模型中,開發者需要將其工作串列化,以避免不同版本之間的問題。
每一個專案都有中心儲存庫,一般也是官方的儲存庫,會用專案維護者管理。開發者會複製中心儲存庫的內容,建立本地儲存庫。開發者再定期確認中心儲存庫的修改內容,使本地儲存庫和中心儲存庫同步。
開發者在本地儲存庫建立新的分支,在分支上修改程式碼。在開發完成之後,再將修改內容整合到中心儲存庫。
在分散式版本控制的軟件中,若要修改軟件,一般會用「拉取請求」(pull request)來進行,也稱為「合併請求」(merge request)[9]。貢獻者請專案維護者「拉取」修改的軟件內容(因此稱為拉取請求),若此修改內容應該成為正式代碼庫的一部份,就需要合併拉取請求中提到的軟件內容[10]。
開發者在有新的軟件變更時,會提出「拉取請求」,告訢專案維護者有新的軟件變更。一般而言每一個拉取請求會有對應的討論串,可以針對軟件修改的內容進行討論(代碼審查)。可以存取儲存庫的人都可以看到提交的拉取請求。專案維護者可以接受或是拒絕拉取請求的內容[11]。
若拉取請求經過審查,已被核可,就會合併到儲存庫中。依工作流程的不同,有可能在加入這段程式的軟件版本正式發行前,進行軟件的測試。因此,有些專案會有一個特殊的分支,合併未測試的拉取請求[10][12]。也有些專案會有自動化測試平台,執行並測試每一個拉取請求的內容,可能會用持續整合工具(例如Travis CI),再由審查者檢查新的程式碼測試覆蓋率是否足夠。
歷史
第一代的開源分散式版本控制系統有GNU arch、Monotone和Darcs,不過開源的分散式版本控制系統一開始並不太流行,直到Git及Mercurial發佈後才流行。
在2002年至2005年時,Linux內核的開發是透過BitKeeper[13]。Git會推出的原因就是因為BitKeeper的公司收回了給Linus Torvalds及Linux核心開發者的免費軟件授權[13]。
相關條目
參考文獻
外部連結
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.