經(jīng)常有這樣的事情,當(dāng)你在一個項目上工作時,你需要在其中使用另外一個項目。也許它是一個第三方開發(fā)的庫或者是你獨立開發(fā)和并在多個父項目中使用的。這個場景下一個常見的問題產(chǎn)生了:你想將兩個項目單獨處理但是又需要在其中一個中使用另外一個。
這里有一個例子。假設(shè)你在開發(fā)一個網(wǎng)站,為之創(chuàng)建Atom源。你不想編寫一個自己的Atom生成代碼,而是決定使用一個庫。你可能不得不像CPAN install或者Ruby gem一樣包含來自共享庫的代碼,或者將代碼拷貝到你的項目樹中。如果采用包含庫的辦法,那么不管用什么辦法都很難去定制這個庫,部署它就更加困難了,因為你必須確保每個客戶都擁有那個庫。把代碼包含到你自己的項目中帶來的問題是,當(dāng)上游被修改時,任何你進行的定制化的修改都很難歸并。
Git 通過子模塊處理這個問題。子模塊允許你將一個 Git 倉庫當(dāng)作另外一個Git倉庫的子目錄。這允許你克隆另外一個倉庫到你的項目中并且保持你的提交相對獨立。
假設(shè)你想把 Rack 庫(一個 Ruby 的 web 服務(wù)器網(wǎng)關(guān)接口)加入到你的項目中,可能既要保持你自己的變更,又要延續(xù)上游的變更。首先你要把外部的倉庫克隆到你的子目錄中。你通過git submodule add
將外部項目加為子模塊:
$ git submodule add git://github.com/chneukirchen/rack.git rack
Initialized empty Git repository in /opt/subtest/rack/.git/
remote: Counting objects: 3181, done.
remote: Compressing objects: 100% (1534/1534), done.
remote: Total 3181 (delta 1951), reused 2623 (delta 1603)
Receiving objects: 100% (3181/3181), 675.42 KiB | 422 KiB/s, done.
Resolving deltas: 100% (1951/1951), done.
現(xiàn)在你就在項目里的rack
子目錄下有了一個 Rack 項目。你可以進入那個子目錄,進行變更,加入你自己的遠程可寫倉庫來推送你的變更,從原始倉庫拉取和歸并等等。如果你在加入子模塊后立刻運行git status
,你會看到下面兩項:
$ git status
# On branch master
# Changes to be committed:
# (use "git reset HEAD <file>..." to unstage)
#
# new file: .gitmodules
# new file: rack
#
首先你注意到有一個.gitmodules
文件。這是一個配置文件,保存了項目 URL 和你拉取到的本地子目錄
$ cat .gitmodules
[submodule "rack"]
path = rack
url = git://github.com/chneukirchen/rack.git
如果你有多個子模塊,這個文件里會有多個條目。很重要的一點是這個文件跟其他文件一樣也是處于版本控制之下的,就像你的.gitignore
文件一樣。它跟項目里的其他文件一樣可以被推送和拉取。這是其他克隆此項目的人獲知子模塊項目來源的途徑。
git status
的輸出里所列的另一項目是 rack 。如果你運行在那上面運行git diff
,會發(fā)現(xiàn)一些有趣的東西:
$ git diff --cached rack
diff --git a/rack b/rack
new file mode 160000
index 0000000..08d709f
--- /dev/null
+++ b/rack
@@ -0,0 +1 @@
+Subproject commit 08d709f78b8c5b0fbeb7821e37fa53e69afcf433
盡管rack
是你工作目錄里的子目錄,但 Git 把它視作一個子模塊,當(dāng)你不在那個目錄里時并不記錄它的內(nèi)容。取而代之的是,Git 將它記錄成來自那個倉庫的一個特殊的提交。當(dāng)你在那個子目錄里修改并提交時,子項目會通知那里的 HEAD 已經(jīng)發(fā)生變更并記錄你當(dāng)前正在工作的那個提交;通過那樣的方法,當(dāng)其他人克隆此項目,他們可以重新創(chuàng)建一致的環(huán)境。
這是關(guān)于子模塊的重要一點:你記錄他們當(dāng)前確切所處的提交。你不能記錄一個子模塊的master
或者其他的符號引用。
當(dāng)你提交時,會看到類似下面的:
$ git commit -m 'first commit with submodule rack'
[master 0550271] first commit with submodule rack
2 files changed, 4 insertions(+), 0 deletions(-)
create mode 100644 .gitmodules
create mode 160000 rack
注意 rack 條目的 160000 模式。這在Git中是一個特殊模式,基本意思是你將一個提交記錄為一個目錄項而不是子目錄或者文件。
你可以將rack
目錄當(dāng)作一個獨立的項目,保持一個指向子目錄的最新提交的指針然后反復(fù)地更新上層項目。所有的Git命令都在兩個子目錄里獨立工作:
$ git log -1
commit 0550271328a0038865aad6331e620cd7238601bb
Author: Scott Chacon <schacon@gmail.com>
Date: Thu Apr 9 09:03:56 2009 -0700
first commit with submodule rack
$ cd rack/
$ git log -1
commit 08d709f78b8c5b0fbeb7821e37fa53e69afcf433
Author: Christian Neukirchen <chneukirchen@gmail.com>
Date: Wed Mar 25 14:49:04 2009 +0100
Document version change
這里你將克隆一個帶子模塊的項目。當(dāng)你接收到這樣一個項目,你將得到了包含子項目的目錄,但里面沒有文件:
$ git clone git://github.com/schacon/myproject.git
Initialized empty Git repository in /opt/myproject/.git/
remote: Counting objects: 6, done.
remote: Compressing objects: 100% (4/4), done.
remote: Total 6 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (6/6), done.
$ cd myproject
$ ls -l
total 8
-rw-r--r-- 1 schacon admin 3 Apr 9 09:11 README
drwxr-xr-x 2 schacon admin 68 Apr 9 09:11 rack
$ ls rack/
$
rack
目錄存在了,但是是空的。你必須運行兩個命令:git submodule init
來初始化你的本地配置文件,git submodule update
來從那個項目拉取所有數(shù)據(jù)并檢出你上層項目里所列的合適的提交:
$ git submodule init
Submodule 'rack' (git://github.com/chneukirchen/rack.git) registered for path 'rack'
$ git submodule update
Initialized empty Git repository in /opt/myproject/rack/.git/
remote: Counting objects: 3181, done.
remote: Compressing objects: 100% (1534/1534), done.
remote: Total 3181 (delta 1951), reused 2623 (delta 1603)
Receiving objects: 100% (3181/3181), 675.42 KiB | 173 KiB/s, done.
Resolving deltas: 100% (1951/1951), done.
Submodule path 'rack': checked out '08d709f78b8c5b0fbeb7821e37fa53e69afcf433'
現(xiàn)在你的rack
子目錄就處于你先前提交的確切狀態(tài)了。如果另外一個開發(fā)者變更了 rack 的代碼并提交,你拉取那個引用然后歸并之,將得到稍有點怪異的東西:
$ git merge origin/master
Updating 0550271..85a3eee
Fast forward
rack | 2 +-
1 files changed, 1 insertions(+), 1 deletions(-)
[master*]$ git status
# On branch master
# Changes not staged for commit:
# (use "git add <file>..." to update what will be committed)
# (use "git checkout -- <file>..." to discard changes in working directory)
#
# modified: rack
#
你歸并來的僅僅上是一個指向你的子模塊的指針;但是它并不更新你子模塊目錄里的代碼,所以看起來你的工作目錄處于一個臨時狀態(tài):
$ git diff
diff --git a/rack b/rack
index 6c5e70b..08d709f 160000
--- a/rack
+++ b/rack
@@ -1 +1 @@
-Subproject commit 6c5e70b984a60b3cecd395edd5b48a7575bf58e0
+Subproject commit 08d709f78b8c5b0fbeb7821e37fa53e69afcf433
事情就是這樣,因為你所擁有的指向子模塊的指針和子模塊目錄的真實狀態(tài)并不匹配。為了修復(fù)這一點,你必須再次運行git submodule update
:
$ git submodule update
remote: Counting objects: 5, done.
remote: Compressing objects: 100% (3/3), done.
remote: Total 3 (delta 1), reused 2 (delta 0)
Unpacking objects: 100% (3/3), done.
From git@github.com:schacon/rack
08d709f..6c5e70b master -> origin/master
Submodule path 'rack': checked out '6c5e70b984a60b3cecd395edd5b48a7575bf58e0'
每次你從主項目中拉取一個子模塊的變更都必須這樣做??雌饋砗芄值枪苡?。
一個常見問題是當(dāng)開發(fā)者對子模塊做了一個本地的變更但是并沒有推送到公共服務(wù)器。然后他們提交了一個指向那個非公開狀態(tài)的指針然后推送上層項目。當(dāng)其他開發(fā)者試圖運行git submodule update
,那個子模塊系統(tǒng)會找不到所引用的提交,因為它只存在于第一個開發(fā)者的系統(tǒng)中。如果發(fā)生那種情況,你會看到類似這樣的錯誤:
$ git submodule update
fatal: reference isn’t a tree: 6c5e70b984a60b3cecd395edd5b48a7575bf58e0
Unable to checkout '6c5e70b984a60b3cecd395edd5ba7575bf58e0' in submodule path 'rack'
你不得不去查看誰最后變更了子模塊
$ git log -1 rack
commit 85a3eee996800fcfa91e2119372dd4172bf76678
Author: Scott Chacon <schacon@gmail.com>
Date: Thu Apr 9 09:19:14 2009 -0700
added a submodule reference I will never make public. hahahahaha!
然后,你給那個家伙發(fā)電子郵件說他一通。
有時候,開發(fā)者想按照他們的分組獲取一個大項目的子目錄的子集。如果你是從 CVS 或者 Subversion 遷移過來的話這個很常見,在那些系統(tǒng)中你已經(jīng)定義了一個模塊或者子目錄的集合,而你想延續(xù)這種類型的工作流程。
在 Git 中實現(xiàn)這個的一個好辦法是你將每一個子目錄都做成獨立的 Git 倉庫,然后創(chuàng)建一個上層項目的 Git 倉庫包含多個子模塊。這個辦法的一個優(yōu)勢是你可以在上層項目中通過標(biāo)簽和分支更為明確地定義項目之間的關(guān)系。
使用子模塊并非沒有任何缺點。首先,你在子模塊目錄中工作時必須相對小心。當(dāng)你運行git submodule update
,它會檢出項目的指定版本,但是不在分支內(nèi)。這叫做獲得一個分離的頭——這意味著 HEAD 文件直接指向一次提交,而不是一個符號引用。問題在于你通常并不想在一個分離的頭的環(huán)境下工作,因為太容易丟失變更了。如果你先執(zhí)行了一次submodule update
,然后在那個子模塊目錄里不創(chuàng)建分支就進行提交,然后再次從上層項目里運行git submodule update
同時不進行提交,Git會毫無提示地覆蓋你的變更。技術(shù)上講你不會丟失工作,但是你將失去指向它的分支,因此會很難取到。
為了避免這個問題,當(dāng)你在子模塊目錄里工作時應(yīng)使用git checkout -b work
創(chuàng)建一個分支。當(dāng)你再次在子模塊里更新的時候,它仍然會覆蓋你的工作,但是至少你擁有一個可以回溯的指針。
切換帶有子模塊的分支同樣也很有技巧。如果你創(chuàng)建一個新的分支,增加了一個子模塊,然后切換回不帶該子模塊的分支,你仍然會擁有一個未被追蹤的子模塊的目錄
$ git checkout -b rack
Switched to a new branch "rack"
$ git submodule add git@github.com:schacon/rack.git rack
Initialized empty Git repository in /opt/myproj/rack/.git/
...
Receiving objects: 100% (3184/3184), 677.42 KiB | 34 KiB/s, done.
Resolving deltas: 100% (1952/1952), done.
$ git commit -am 'added rack submodule'
[rack cc49a69] added rack submodule
2 files changed, 4 insertions(+), 0 deletions(-)
create mode 100644 .gitmodules
create mode 160000 rack
$ git checkout master
Switched to branch "master"
$ git status
# On branch master
# Untracked files:
# (use "git add <file>..." to include in what will be committed)
#
# rack/
你將不得不將它移走或者刪除,這樣的話當(dāng)你切換回去的時候必須重新克隆它——你可能會丟失你未推送的本地的變更或分支。
最后一個需要引起注意的是關(guān)于從子目錄切換到子模塊的。如果你已經(jīng)跟蹤了你項目中的一些文件但是想把它們移到子模塊去,你必須非常小心,否則Git會生你的氣。假設(shè)你的項目中有一個子目錄里放了 rack 的文件,然后你想將它轉(zhuǎn)換為子模塊。如果你刪除子目錄然后運行submodule add
,Git會向你大吼:
$ rm -Rf rack/
$ git submodule add git@github.com:schacon/rack.git rack
'rack' already exists in the index
你必須先將rack
目錄撤回。然后你才能加入子模塊:
$ git rm -r rack
$ git submodule add git@github.com:schacon/rack.git rack
Initialized empty Git repository in /opt/testsub/rack/.git/
remote: Counting objects: 3184, done.
remote: Compressing objects: 100% (1465/1465), done.
remote: Total 3184 (delta 1952), reused 2770 (delta 1675)
Receiving objects: 100% (3184/3184), 677.42 KiB | 88 KiB/s, done.
Resolving deltas: 100% (1952/1952), done.
現(xiàn)在假設(shè)你在一個分支里那樣做了。如果你嘗試切換回一個仍然在目錄里保留那些文件而不是子模塊的分支時——你會得到下面的錯誤:
$ git checkout master
error: Untracked working tree file 'rack/AUTHORS' would be overwritten by merge.
你必須先移除rack
子模塊的目錄才能切換到不包含它的分支:
$ mv rack /tmp/
$ git checkout master
Switched to branch "master"
$ ls
README rack
然后,當(dāng)你切換回來,你會得到一個空的rack
目錄。你可以運行git submodule update
重新克隆,也可以將/tmp/rack
目錄重新移回空目錄。
更多建議: