1、SHA
在git中,全部用來表示項目歷史信息的文件,是經過一個40個字符的(40-digit)「對象名」來索引的,對象名看起來像這樣:
6ff87c4664981e4397625791c8ea3bbb5f2279a3
你會在Git裏處處看到這種「40個字符」字符串。每個「對象名」都是對「對象」內容作SHA1哈希計算得來的,(SHA1是一種密碼學的哈希算法)。這樣就意味着兩個不一樣內容的對象不可能有相同的「對象名」。
這樣作會有幾個好處:
A、Git只要比較對象名,就能夠很快的判斷兩個對象是否相同。
B、由於在每一個倉庫(repository)的「對象名」的計算方法都徹底同樣,若是一樣的內容存在兩個不一樣的倉庫中,就會存在相同的「對象名」下。
C、Git還能夠經過檢查對象內容的SHA1的哈希值和「對象名」是否相同,來判斷對象內容是否正確。
2、對象
每一個對象(object) 包括三個部分:類型,大小和內容。大小就是指內容的大小,內容取決於對象的類型,有四種類型的對象:"blob"、"tree"、 "commit" 和"tag"。
「blob」用來存儲文件數據,一般是一個文件。
「tree」有點像一個目錄,它管理一些「tree」或是 「blob」(就像文件和子目錄)
一個「commit」只指向一個"tree",它用來標記項目某一個特定時間點的狀態。它包括一些關於時間點的元數據,如時間戳、最近一次提交的做者、指向上次提交(commits)的指針等等。
一個「tag」是來標記某一個提交(commit) 。
幾乎全部的Git功能都是使用這四個簡單的對象類型來完成的。它就像是在你本機的文件系統之上構建一個小的文件系統。
3、與SVN的區別
Git與你熟悉的大部分版本控制系統的差異是很大的。也許你熟悉Subversion、CVS、Perforce、Mercurial 等等,他們使用 「增量文件系統」 (Delta Storage systems), 就是說它們存儲每次提交(commit)之間的差別。Git正好與之相反,它會把你的每次提交的文件的所有內容(snapshot)都會記錄下來。這會是在使用Git時的一個很重要的理念。
4、Blob對象
一個blob一般用來存儲文件的內容.
你可使用git show命令來查看一個blob對象裏的內容。假設咱們如今有一個Blob對象的SHA1哈希值,咱們能夠經過下面的的命令來查看內容:
$ git show 6ff87c4664
Note that the only valid version of the GPL as far as this project
is concerned is _this_ particular version of the license (ie v2, not
v2.2 or v3.x or whatever), unless explicitly otherwise stated.
...
一個"blob對象"就是一塊二進制數據,它沒有指向任何東西或有任何其它屬性,甚至連文件名都沒有.
由於blob對象內容所有都是數據,如兩個文件在一個目錄樹(或是一個版本倉庫)中有一樣的數據內容,那麼它們將會共享同一個blob對象。Blob對象和其所對應的文件所在路徑、文件名是否改被更改都徹底沒有關係。
5、Tree 對象
一個tree對象有一串(bunch)指向blob對象或是其它tree對象的指針,它通常用來表示內容之間的目錄層次關係。
git show命令還能夠用來查看tree對象,可是git ls-tree能讓你看到更多的細節。若是咱們有一個tree對象的SHA1哈希值,咱們能夠像下面同樣來查看它:
$ git ls-tree fb3a8bdd0ce
100644 blob 63c918c667fa005ff12ad89437f2fdc80926e21c .gitignore
100644 blob 5529b198e8d14decbe4ad99db3f7fb632de0439d .mailmap
100644 blob 6ff87c4664981e4397625791c8ea3bbb5f2279a3 COPYING
040000 tree 2fb783e477100ce076f6bf57e4a6f026013dc745 Documentation
100755 blob 3c0032cec592a765692234f1cba47dfdcc3a9200 GIT-VERSION-GEN
100644 blob 289b046a443c0647624607d471289b2c7dcd470b INSTALL
100644 blob 4eb463797adc693dc168b926b6932ff53f17d0b1 Makefile
100644 blob 548142c327a6790ff8821d67c2ee1eff7a656b52 README
...
就如同你所見,一個tree對象包括一串(list)條目,每個條目包括:mode、對象類型、SHA1值 和名字(這串條目是按名字排序的)。它用來表示一個目錄樹的內容。
一個tree對象能夠指向(reference): 一個包含文件內容的blob對象, 也能夠是其它包含某個子目錄內容的其它tree對象. Tree對象、blob對象和其它全部的對象同樣,都用其內容的SHA1哈希值來命名的;只有當兩個tree對象的內容徹底相同(包括其所指向全部子對象)時,它的名字纔會同樣,反之亦然。這樣就能讓Git僅僅經過比較兩個相關的tree對象的名字是否相同,來快速的判斷其內容是否不一樣。
(注意:在submodules裏,trees對象也能夠指向commits對象. 請參見 Submodules 章節)
注意:全部的文件的mode位都是644 或 755,這意味着Git只關心文件的可執行位.
6、Commit對象
"commit對象"指向一個"tree對象", 而且帶有相關的描述信息.
你能夠用 --pretty=raw 參數來配合 git show 或 git log 去查看某個提交(commit):
$ git show -s --pretty=raw 2be7fcb476
commit 2be7fcb4764f2dbcee52635b91fedb1b3dcf7ab4
tree fb3a8bdd0ceddd019615af4d57a53f43d8cee2bf
parent 257a84d9d02e90447b149af58b271c19405edb6a
author Dave Watson <dwatson@mimvista.com> 1187576872 -0400
committer Junio C Hamano <gitster@pobox.com> 1187591163 -0700
Fix misspelling of 'suppress' in docs
Signed-off-by: Junio C Hamano <gitster@pobox.com>
你能夠看到, 一個提交(commit)由如下的部分組成:
一個 tree對象: tree對象的SHA1簽名, 表明着目錄在某一時間點的內容.
父對象 (parent(s)): 提交(commit)的SHA1簽名表明着當前提交前一步的項目歷史. 上面的那個例子就只有一個父對象; 合併的提交(merge commits)可能會有不僅一個父對象. 若是一個提交沒有父對象, 那麼咱們就叫它「根提交"(root commit), 它就表明着項目最初的一個版本(revision). 每一個項目必須有至少有一個「根提交"(root commit). 一個項目可能有多個"根提交「,雖然這並不常見(這不是好的做法).
做者 : 作了這次修改的人的名字, 還有修改日期.
提交者(committer): 實際建立提交(commit)的人的名字, 同時也帶有提交日期. TA可能會和做者不是同一我的; 例如做者寫一個補丁(patch)並把它用郵件發給提交者, 由他來建立提交(commit).
註釋 用來描述這次提交.
注意: 一個提交(commit)自己並無包括任何信息來講明其作了哪些修改; 全部的修改(changes)都是經過與父提交(parents)的內容比較而得出的. 值得一提的是, 儘管git能夠檢測到文件內容不變而路徑改變的狀況, 可是它不會去顯式(explicitly)的記錄文件的改名操做. (你能夠看一下 git diff 的 -M 參數的用法)
通常用 git commit 來建立一個提交(commit), 這個提交(commit)的父對象通常是當前分支(current HEAD), 同時把存儲在當前索引(index)的內容所有提交.
7、對象模型
如今咱們已經瞭解了3種主要對象類型(blob, tree 和 commit), 好如今就讓咱們大概瞭解一下它們怎麼組合到一塊兒的.
若是咱們一個小項目, 有以下的目錄結構:
$>tree
|-- README
`-- lib
|-- inc
| `-- tricks.rb
`-- mylib.rb
2 directories, 3 files
若是咱們把它提交(commit)到一個Git倉庫中, 在Git中它們也許看起來就以下圖:
你能夠看到: 每一個目錄都建立了 tree對象 (包括根目錄), 每一個文件都建立了一個對應的 blob對象 . 最後有一個 commit對象 來指向根tree對象(root of trees), 這樣咱們就能夠追蹤項目每一項提交內容.
8、標籤對象
一個標籤對象包括一個對象名(譯者注:就是SHA1簽名), 對象類型, 標籤名, 標籤建立人的名字("tagger"), 還有一條可能包含有簽名(signature)的消息.
$ git cat-file tag v1.5.0
object 437b1b20df4b356c9342dac8d38849f24ef44f27
type commit
tag v1.5.0
tagger Junio C Hamano <junkio@cox.net> 1171411200 +0000
GIT 1.5.0
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.6 (GNU/Linux)
iD8DBQBF0lGqwMbZpPMRm5oRAuRiAJ9ohBLd7s2kqjkKlq1qqC57SbnmzQCdG4ui
nLE/L9aUXdWeTFPron96DLA=
=2E+0
-----END PGP SIGNATURE-----
注意: git tag 一樣也能夠用來建立 "輕量級的標籤"(lightweight tags), 但它們並非標籤對象, 而只一些以 "refs/tags/" 開頭的引用罷了